阿里通义千问发布 Qwen2.5-Turbo AI 模型：支持 100 万 tokens 上下文，处理时间缩短至 68 秒

11 月 19 日消息，阿里通义千问昨日（11 月 18 日）发布博文，宣布在经过数月的优化和打磨后，针对社区中对更长上下文长度（Context Length）的要求，推出了 Qwen2.5-Turbo 开源 AI模型。

Qwen2.5-Turbo 将上下文长度从 12.8 万个扩展至 100 万个 tokens，这一改进相当于约 100 万英语单词或 150 万汉字，可以容纳 10 部完整小说、150 小时的演讲稿或 30000 行代码。

注：上下文长度（Context Length）是指在自然语言处理（NLP）中的大型语言模型（LLM）在一次处理过程中能够考虑和生成的文本的最大长度。

该模型在 1M-token 的 Passkey 检索任务中实现了 100% 准确率，RULER 长文本评估得分为 93.1，超越了 GPT-4 和 GLM4-9B-1M。

阿里通义千问发布 Qwen2.5-Turbo AI 模型：支持 100 万 tokens 上下文，处理时间缩短至 68 秒

团队通过整合稀疏注意力机制（sparse attention mechanisms），将处理 100 万 tokens 到输出第一个 tokens 的时间，从 4.9 分钟缩短至 68 秒，速度提升达 4.3 倍，这一进步显著提高了模型的响应效率，使其在处理长文本时更加迅速。

Qwen2.5-Turbo 的处理成本保持在每百万个 tokens 0.3 元，能够处理 3.6 倍于 GPT-4o-mini 的 token 数量。这让 Qwen2.5-Turbo 在经济性上具备了更强的竞争力，成为高效、经济的长上下文处理解决方案。

尽管 Qwen2.5-Turbo 在多个基准测试中表现优异，团队仍然意识到在真实场景中的长序列任务表现可能不够稳定，且大型模型的推理成本需要进一步优化。

团队承诺将继续优化人类偏好、提高推理效率，并探索更强大的长上下文模型。

附上参考地址

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

阿里通义千问发布 Qwen2.5-Turbo AI 模型：支持 100 万 tokens 上下文，处理时间缩短至 68 秒

消息称腾讯杰出科学家、混元大模型技术负责人之一刘威离职

谷歌回应 Gemini 聊天机器人回复“人类去死吧”：已采取措施防止类似事件再次发生

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

消息称腾讯杰出科学家、混元大模型技术负责人之一刘威离职

谷歌回应 Gemini 聊天机器人回复“人类去死吧”：已采取措施防止类似事件再次发生

阿里云宣布“通义舞王”免费上线 ：仅凭一张照片就可生成AI跳舞视频

通义千问开源Qwen1.5-32B 模型系列

英伟达发布 80 亿参数新 AI模型：精度、效率高，可在 RTX 工作站上部署

阿里通义千问开源 Qwen2.5-Coder 全系列模型，号称代码能力追平 GPT-4o

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

阿里云宣布“通义舞王”免费上线：仅凭一张照片就可生成AI跳舞视频