助视障者“看见”世界，复旦大学团队研发“眸思”大模型、“听见世界”App

据复旦大学官方公众号，在复旦大学自然语言处理实验室 (FudanNLP) 师生的努力下，基于多模态大模型“复旦・眸思”(MouSi) 为视障者量身打造的“听见世界”App 上线。

这套系统仅需一枚摄像头、一对耳机，就能将画面转化为语言，且支持描绘场景、提示风险等功能。“听见世界”App 可为视障者日常生活需求设计三种模式。

街道行走：该模式下，“眸思”能够细致扫描道路情况，提示潜在风险。
自由问答：可帮助视障者走进博物馆、艺术馆、公园，捕捉四周景象每个细节，可用声音构建丰富的生活场景，官方演示图显示，该 App 还可实现转述电视画面内容等功能。
寻物：该模式为视障者提供日常物件的寻觅功能，官方称其为“可靠管家”。

据悉，预计今年 3 月，“听见世界”App 将完成第一轮测试，并在中国一、二线城市和地区同步开启试点，根据算力部署情况进行推广。

复旦大学自然语言处理实验室（FudanNLP）此前开发了 MOSS 大模型，2023 年 4 月宣布正式开源，成为国内首个插件增强的开源对话语言模型。半年时间后，多模态模型“眸思”问世。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

助视障者“看见”世界，复旦大学团队研发“眸思”大模型、“听见世界”App

侵犯公民个人信息、非法获利 3.5 万元，3 人因用变脸软件帮他人解封账号获刑

“4K 高清版”气象大模型：上海人工智能实验室“风乌”实现 10 公里级气象预报

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

侵犯公民个人信息、非法获利 3.5 万元，3 人因用变脸软件帮他人解封账号获刑

“4K 高清版”气象大模型：上海人工智能实验室“风乌”实现 10 公里级气象预报

百度智能云企业知识管理平台“甄知”通过信通院大模型专项评估

商汤发布“东风”泰语大模型：全球首次实现可在泰 / 中 / 英环境下高效工作

小米大模型小爱宣布新增AI文档问答、AI 图片编辑等功能

“要把大模型拉下神坛”，周鸿祎宣布 360 安全大模型免费

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注