消息称 OpenAI 将推出多模态人工智能数字助理：可语音对话、识别物体

据 The Information 报道，OpenAI 最近向部分客户展示了一款新型多模态人工智能模型，该模型能够进行语音对话和物体识别。有消息人士透露，这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。

图源 Pexels

报道称，相比于 OpenAI 现有的独立图像识别和文本转语音模型，该新型模型能够更快、更准确地处理图像和音频信息。例如，它可以帮助客服人员“更好地理解来电者的语气语调，判断他们是否在使用讽刺语气”。理论上，该模型还能辅助学生学习数学知识，或翻译现实世界中的标志文字。

不过，消息人士也指出，虽然该模型在某些问题解答方面能够超越 GPT-4 Turbo，但仍有可能出现自信地给出错误答案的情况。

消息称 OpenAI 将推出多模态人工智能数字助理：可语音对话、识别物体

开发者 Ananay Arora 发布了一张包含通话相关代码的截图，暗示 OpenAI 可能正在为 ChatGPT 加入打电话的功能。Arora 还发现了一些证据表明 OpenAI 正在配置用于实时音视频通信的服务器。

OpenAI 首席执行官萨姆・阿尔特曼 (Sam Altman) 已经明确否认即将发布的新品是代号为 GPT-5 的大型语言模型（据称其性能将大幅优于 GPT-4）。The Information 则表示，GPT-5 可能将在今年年底前正式亮相。阿尔特曼还表示，OpenAI 不会发布新的人工智能搜索引擎。

如果 The Information 的报道属实，OpenAI 的新品发布仍可能会对即将举行的 Google I / O 开发者大会产生一定影响。众所周知，谷歌也在测试利用人工智能进行电话呼叫的技术。此外，谷歌还有一个据传即将发布的项目，代号为“Pixie”。Pixie 是一款能够通过设备摄像头识别物体的多模态 Google Assistant 替代品，可以为用户提供诸如“如何前往购买地点”或“如何使用”等信息。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

消息称 OpenAI 将推出多模态人工智能数字助理：可语音对话、识别物体

安全公司警告黑客正瞄准各大 AI 语言模型平台用户账号，转卖 API 余额 / 获取隐私信息

美国加州政府测试 ChatGPT 等生成式应用于4个部门，改善税收和交通等难题

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

安全公司警告黑客正瞄准各大 AI 语言模型平台用户账号，转卖 API 余额 / 获取隐私信息

​美国加州政府测试 ChatGPT 等生成式应用于4个部门，改善税收和交通等难题

英国监管机构将审查微软与OpenAI的合作

消息称 OpenAI 挖角谷歌员工开发 AI 搜索引擎

斯嘉丽·约翰逊控诉 ChatGPT 复制其声音，OpenAI 文件显示并非故意模仿

两名前董事称 OpenAI 自我管理能力“不可靠”：将会向利润屈服

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

美国加州政府测试 ChatGPT 等生成式应用于4个部门，改善税收和交通等难题