在今日的 2024 百度世界大会上,百度创始人李彦宏发布了两项新的 AI 技术 —— 检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
李彦宏表示,文心大模型最新的日均调用量已经来到 15 亿,较半年前(2 亿调用量)增长至 7.5 倍。
幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是 RAG,即检索增强。李彦宏表示,过去 24 个月对于大模型行业而言,最大的变化是“大模型基本上消除了幻觉”,回答问题的准确性大大地提升了。“让 AI 从一本正经的胡说八道变得可用,可被信赖”,他说。
不过,目前基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了 AI 的实用性。
针对上述问题,百度开发了检索增强的文生图技术 iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,“整体效果远远超过文生图原生系统,去除了机器味儿”。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心 iRAG 技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。
李彦宏还在大会上发布了无代码工具“秒哒”。该工具支持无代码编程、多智能体协作和多工具调用三大特性,号称用自然语言就能搭建一整套系统。
演讲现场,李彦宏以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。