Meta开源OpenEQA,评估AI Agent情景理解能力

Meta推出OpenEQA基准数据集,旨在通过情景记忆与主动探索任务,衡量AI代理对环境的理解;OpenEQA包含1600多个问题,涵盖属性识别、空间理解等,使用真实环境扫描和视频模拟;实验发现,多模态视觉语言模型(如GPT-4V)在EQA任务上优于纯文本模型,但仍有提升空间。(夕小瑶科技说)

搜索