近期,谷歌在 Google I/O 大会上宣布了一系列新功能和产品,备受期待。尽管大部分尚未发布,但已经可以窥探到正在进行的一些开发工作。谷歌计划于7月15日和7月18日发布五款 Gemini 产品,下面我们来一探究竟!
根据前端代码的逆向工程和相关泄漏消息,可以初步了解到即将发布的 Gemini 产品可能包括:新版 Imagen3、Gemini 定制 GPT、个性化回应功能、预定提示功能、录音和 Google Photos 集成等。此外,还有关于即时增强功能和 Gemini Chrome 扩展程序的发展。
Imagen3预计将向 AI Labs 的 alpha 测试人员开放,最终也可能向 Gemini Advanced 用户开放。虽然下周发布的可能性不大,但考虑到 Imagen2的质量以及欧盟缺乏图像生成功能,这是一个备受期待的版本。有传言称,第一批邀请将发送给 AI Labs Discord 成员和高级订阅用户。
GEMs
Gemini 的定制 GPT,称为 GEM(以前称为“Bot”),早在 I/O 宣布之前就已开始开发。用户将能够查看、编辑和复制 GEM,这些操作可通过 GEMs Manager 选项卡进行访问。鉴于其开发时间较长,GEMs 可能是一个重要的版本,但也可能会延迟。
记忆/个性化回应功能
这个一功能在侧面菜单中显示为一个单独的部分,位于 Gemini 响应图标后面。工具提示表明此按钮将允许用户安排提示。在专用选项卡中,用户可能会看到计划任务的列表。这项独特功能可以让用户要求 Gemini 每天早上向他们发送每日新闻,与 GEM 配合使用效果很好。
预设提示词
此功能已在代码中存在一段时间,预计其功能类似于 ChatGPT 上的记忆功能。用户将在设置中拥有一个专用选项来访问个性化部分。但是,由于此部分名为“个性化回复”,可能会有一些调整。
录音和 Google Photos 集成
附件选项表明有两个新增内容:
语音录制:允许用户录制消息并以 .wav 文件形式发送。虽然录音功能似乎可行,但感觉距离发布还很远。
Google Photos 集成:似乎已接近完成,允许用户直接从网络上的 Photos 应用中选择照片。然而,它仍然无法解决无法一次上传多张图片的问题。
新的隐藏按钮可能根据其外观和名称起到提示增强的作用。
除此之外,早前发现了 Android 版 Gemini 的更多功能,同时谷歌也正在招募 iOS 版谷歌应用的 Beta 测试人员,预示着 iOS 版 Gemini 更新可能即将推出。另外,未来的更新可能包括禁用实时响应的功能。
Gemini 作为谷歌最新、最先进的人工智能模型,代表着人工智能能力的重大飞跃,其功能和应用场景正在不断扩展。