-
AI“推理”模型兴起,基准测试成本飙升
随着人工智能(AI)技术的不断发展,所谓的“推理”AI模型成为了研究热点。这些模型能够像人类一样逐步思考问题,在特定领域,如物理学中,被认为比非推理模型能力更强。然而,这种优势却伴随着高昂的测试成本,使得独立验证这些模型的能力变得困难重重。 据第三方 AI 测试机构“人工智能分析”(Artificial Analysis)提供的数据显示,评估 OpenAI 的 o1 推理模型在七个流行的 AI 基…- 243
-
谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生
4 月 10 日消息,谷歌今日推出了一款名为 Gemini 2.5 Flash 的全新 AI模型,该模型注重高效能,并提供强劲的性能。 据1AI了解,Gemini 2.5 Flash 即将登陆谷歌的 AI 开发平台 Vertex AI。谷歌公司表示,该模型具备“动态且可控”的计算能力,开发者能够根据查询请求的复杂程度灵活调整处理时间。谷歌在一篇博客文章中写道:“你可以针对特定需求来调整速度、准确性…- 299
-
Meta 发布 Llama 4 系列 AI模型,引入“混合专家架构”提升效率
4 月 6 日消息,Meta 现已发布旗下最新 Llama 4 系列 AI模型,包含 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth,Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练,以使它们具备“广泛的视觉理解能力”。 目前,Meta 已将系列模型中的 Scout 和 Maverick 上架到 Hugging Face(…- 1.4k
-
谷歌迄今最贵 AI模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起
4 月 5 日消息,当地时间周五,谷歌公布了 Gemini 2.5 Pro 的 API 定价。对于最多 200000 个 tokens 的输入,Gemini 2.5 Pro 的费用为每百万输入 tokens 1.25 美元(注:现汇率约合 9.1 元人民币,大约 750000 个单词),每百万输出 tokens 为 10 美元(现汇率约合 72.9 元人民币)。 而对于超过 200000 个 to…- 1.7k
-
加州大学研究:AI模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试
4 月 2 日消息,美国加州大学圣地亚哥分校发布了一项研究成果,宣称首次提供了“人工智能系统能够通过标准三方图灵测试的实证证据”。 图灵测试由英国数学家和计算机科学家阿兰・图灵于 1950 年提出,他称之为“模仿游戏”。图灵设想,如果一名提问者在通过文本交流时无法区分对方是机器还是人类,那么这个机器可能具备类似人类的智能。在三方图灵测试中,提问者需与一名人类和一台机器进行对话,并准确辨识出人类身份…- 1.8k
-
“迄今最智能”AI模型登场,谷歌 Gemini 2.5 Pro 免费向公众推出
3 月 30 日消息,谷歌今日宣布,最新的 Gemini AI 旗舰模型 Gemini 2.5 Pro 将免费向所有 Gemini 应用用户开放。此前,该实验性模型仅限于 Gemini Advanced 订阅用户使用。 谷歌本周早些时候发布了 Gemini 2.5 Pro,并称其为迄今“最智能的 AI 模型”,在推理能力上较前代版本进一步增强。新版模型支持多项功能,包括应用和浏览器扩展、文件上传,…- 1.4k
-
英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员
3 月 20 日消息,英伟达最新发布 Llama Nemotron 系列开放推理 AI模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。 Llama Nemotron 系列开放推理 AI 模型共有 Nano、Super 和 Ultra 三种规模,1AI援引博文简单介绍如下: Nano:专为 PC…- 1.7k
-
加拿大初创公司推出 Command A 轻量级 AI 模型,号称仅需两块英伟达 A100 / H100 GPU 即可部署
加拿大 AI 初创公司 Cohere 发布了一款名为“Command A”的 AI模型,该模型主打轻量化应用,号称只需要两块英伟达 A100 或 H100 GPU 即可轻松部署,号称“表现能和 GPT-4o 相媲美”,实现“用最少的硬件发挥最大的性能”。 Cohere 表示,Command A 专门为中小型企业环境设计,其支持 256k 的上下文长度和 23 种语言,作为比较,其他竞争对手的“同类…- 1.6k
-
谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务
北京时间3 月 12 日晚,谷歌 DeepMind 推出两款新型 AI模型,旨在帮助机器人完成更多现实世界中的任务。 其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。 Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型 ——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina …- 2.2k
-
法国出版商和作家协会起诉 Meta,称其“大规模盗窃”版权内容训练 AI模型
法国主要出版商和作家协会对 Meta 提起诉讼,指控 Meta 未经授权大规模使用受版权保护的内容来训练其 AI模型。 法国国家出版联盟(SNE)、国家作者与作曲家联盟(SNAC)以及捍卫作者利益的文学家协会(SGDL)在周三的新闻发布会上表示,他们已对 Meta 提起诉讼,指控其涉嫌侵犯版权和经济“寄生”行为。这三大协会认为,作为 Facebook、Instagram 和 WhatsApp 等社…- 1.1k
-
谷歌推出 Gemma 3:号称可在单块 GPU 上运行的最强 AI模型
3 月 12 日消息,谷歌今日推出了 Gemma 3 人工智能模型,这是继其一年前发布基于与 Gemini AI 相同技术的两款“开放”Gemma AI 模型后的又一升级之作。根据谷歌官方博客消息,Gemma 3 模型专为开发者设计,旨在支持他们构建能够在多种设备上运行的人工智能应用,无论是手机还是工作站,均可实现无缝运行。该模型支持超过 35 种语言,并具备分析文本、图像及短视频的能力。 谷歌声…- 1.8k
-
消息称 DeepSeek-R2 AI 模型将于 3 月 17 日发布
3 月 11 日消息,媒体智通财经援引“消息人士”,称 DeepSeek 下一代 AI模型 DeepSeek-R2 将于 3 月 17 日发布。 据介绍,DeepSeek-R2 在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。相应消息人士认为,这些特性若得以兑现,可能使其在全球 AI 竞赛中占据显著优势。 截至1AI发稿,DeepSeek 官方尚未正…- 1k
-
联发科推出两款多模态轻量级 AI模型:主打繁体中文处理能力、基于 Meta Llama 3.2 打造而成
2 月 19 日消息,联发科创新基地(MediaTek Research)现已发布两款支持繁体中文的轻量级多模态模型,分别是号称可在手机上运行的 Llama-Breeze2-3B 模型和适用于轻薄笔记本电脑的 Llama-Breeze2-8B 模型。 1AI获悉,系列模型基于 Meta Llama 3.2 语言模型打造而成,主打繁体中文处理能力,同时支持多模态输入和函数调用,能够识别图像并调用外部…- 1.1k
-
号称“业界首个对知识产权友好、商用安全”的 LLM,Adobe Firefly 文生视频 AI模型发布
Adobe 2 月 12 日推出了号称是“业界首个对知识产权友好、商业层面可安全使用”的 Firefly 文生视频 AI 模型。相应模型目前可以在 Adobe Firefly 网页端和 Adobe Premiere Pro 的 Generative Extend 功能中体验(当前处于 Beta 测试)。 据 Adobe 介绍,用户可以通过文本提示或图像创建视频,然后通过添加“调整镜头角度”和各种氛…- 1.6k
-
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
1 月 21 日消息,消息源 @sir04680280 于 1 月 19 日发布博文,报道称观看谷歌黑客马拉松直播时,发现谷歌升级版 Gemini AI模型“Gemini 2.0 Flash Thinking Exp-0123”,暗示 1 月 23 日发布。 新模型名称为“Gemini 2.0 Flash Thinking Exp-0123”,应该是现有“Exp-1219”模型的升级版本,可能具备…- 1.9k
-
OpenAI 阿尔特曼:计划几周内推出 o3 mini 推理模型
1 月 18 日消息,OpenAI CEO 萨姆・阿尔特曼今日在 X 上发文称,OpenAI 已完成新推理 AI模型 o3 mini 版本,计划在几周内推出,包括 API 和 ChatGPT 选项,让高级推理 AI 更易用且实惠。 在去年的 12 Days of OpenAI 活动上,OpenAI 的 o3 系列大模型在最后一天压轴登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)…- 2k
-
研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI模型
1月14日消息,纽约大学的一项研究揭示了大型语言模型(LLM)在医学信息训练中的潜在风险。研究表明,即使训练数据中仅含有 0.001% 的错误信息,也可能导致模型输出不准确的医学答案。 数据“投毒”是一个相对简单的概念。LLM 通常通过大量文本进行训练,这些文本大多来自互联网。通过在训练数据中注入特定信息,可以使模型在生成答案时将这些信息视为事实。这种方法甚至不需要直接访问 LLM 本身,只需将目…- 1.8k
-
研究人员开源 Sky-T1 推理 AI模型,训练成本不到 450 美元
1 月 12 日消息,本周,来自加州大学伯克利分校 Sky Computing 实验室的研究团队 NovaSky 发布了一款名为 Sky-T1-32B-Preview 的推理模型。该模型在多项关键基准测试中的表现可与 OpenAI 早期版本的 o1 模型相媲美。值得注意的是,Sky-T1-32B-Preview 似乎是首个真正意义上的开源推理模型,其训练数据集和代码均已公开,用户可以从零开始复现该…- 1.9k
-
马斯克:现实世界中用于训练 AI 模型的数据已经所剩无几
据 TechCrunch 报道,马斯克与其他人工智能专家一致认为,现实世界中用于训练 AI模型的数据几乎已经耗尽。 在周三晚间与 Stagwell 董事会主席马克・佩恩的直播对话中,马斯克表示:“我们现在基本上已经消耗掉了所有人类知识的积累…… 用于人工智能训练的数据。这个现象基本上是去年发生的。” 马斯克此番言论与前 OpenAI 首席科学家伊利亚・苏茨克弗(Ilya Sutskever)在去年…- 2k
-
微软开源 140 亿参数小语言 AI模型 Phi-4,性能比肩 GPT-4o Mini
1 月 9 日消息,在 2024 年 12 月 12 日发布后,微软昨日(1 月 8 日)在 Hugging Face 平台上,开源小语言模型 Phi-4,感兴趣的开发者和尝鲜者可以下载、微调和部署该 AI 模型。 注:该模型参数量仅为 140 亿,却在多个基准测试中表现优异,甚至超越了参数量更大的 Llama 3.3 70B(近五倍于 Phi-4)和 OpenAI 的 GPT-4o Mini;在…- 2.5k
-
Anthropic 新研究:AI模型在训练中存在“阳奉阴违”行为
12 月 19 日消息,人工智能安全公司 Anthropic 发布一项最新研究揭示了人工智能模型可能存在的欺骗行为,即在训练过程中,模型可能会伪装出接受新原则的假象,实则暗地里仍然坚持其原有偏好。研究团队强调,目前无需对此过度恐慌,但这项研究对于理解未来更强大人工智能系统可能构成的潜在威胁至关重要。 据1AI了解,该研究由 Anthropic 与人工智能研究机构 Redwood Research …- 2.2k
-
Meta 发布 Motivo AI模型,打造更逼真元宇宙体验
Meta 公司周四宣布推出名为 Meta Motivo 的人工智能模型,该模型旨在控制类人数字智能体的动作,从而提升元宇宙体验。 Meta 还发布了大型概念模型 LCM 和视频水印工具 Video Seal 等 AI 工具,并重申其对 AI、AR 和元宇宙技术持续投入的决心。 注:Meta Motivo 是一个基于行为的基础模型,在 Mujoco 模拟器中进行训练,使用了 AMASS 动作捕捉数据…- 1.8k
-
DeepSeek V2 系列 AI模型收官,联网搜索上线
12 月 11 日消息,DeepSeek 官方公众号昨日(12 月 10 日)发布博文,宣布 DeepSeek V2 系列收官,推出 DeepSeek V2.5 的最终版微调模型 DeepSeek-V2.5-1210,主要支持联网搜索功能,全面提升各项能力。 DeepSeek-V2.5-1210 通过 Post-Training 迭代,在数学、代码、写作、角色扮演等方面均取得显著进步,此外优化了文…- 2.5k
-
LG 发布 EXAONE 3.5 开源 AI 模型:长文本处理利器、独特技术有效降低“幻觉”
12 月 11 日消息,LG 人工智能研究院本周一(12 月 9 日)发布 EXAONE 3.5 开源 AI模型,并同步推出面向 LG 员工的企业级 AI 智能体服务 ChatEXAONE。 EXAONE 3.5 此次发布的 EXAONE 3.5 距离 3.0 版本仅四个月,新模型提供三个版本:24 亿参数的超轻量级设备端模型、78 亿参数的轻量级通用模型以及 320 亿参数的高性能专用模型。 L…- 2.1k