
最初,Google 只发布 Gemini 2.0 系列的一个模型:Gemini 2.0 Flash 实验版,这是一款超快、轻量级的模型,支持多模式输入和输出。它可以原生生成混合了文本和多语言音频的图像,并可以无缝接入 Google 搜索、代码执行和其他工具。这些功能目前面向开发人员和 beta 测试人员提供预览。尽管规模较小,但 2.0 Flash 在事实性、推理、编码、数学等多个方面都优于 Gemini 1.5 Pro,而且速度也是其两倍。普通用户可以从今天开始在网络上试用对聊天优化的 Gemini 2.0 Flash版本,并且它很快就会出现在 Gemini 移动应用程序中。
谷歌还展示了使用 Gemini 2.0 构建的几项令人印象深刻的体验。首先是 Project Astra 的更新版本,这是谷歌于 2024 年 5 月首次展示的实验性虚拟 AI 代理。借助 Gemini 2.0,它现在可以用多种语言进行对话;使用谷歌搜索、Lens 和地图等工具;记住过去与它的对话中的内容,并在人类对话的延迟下理解语言。Project Astra 旨在在智能手机和透视上运行,但目前仅限于一小群值得信赖的测试人员。那些有兴趣在 Android 手机上试用原型的人可以在此处加入候补名单。还有这个非常酷的多模式实时 API 演示,它有点类似于 Project Astra,可以让你使用视频、语音和屏幕共享与聊天机器人实时互动。