360 智脑 7B 参数大模型开源，支持 50 万字长文本输入

360 公司日前在 GitHub 上开源了 360 智脑 7B（70 亿参数模型）。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练，以中文、英文、代码为主，开放 4K、32K、360K 三种不同文本长度。360 表示，360K（约 50 万字）是当前国产开源模型文本长度最长的。

360 表示，他们在 OpenCompass 的主流评测数据集上验证了模型性能，包括 C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA，考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中 360 模型在四个评测数据集上达到第一，平均分为第三。

360 智脑 7B 参数大模型开源，支持 50 万字长文本输入

在 LongBench（多任务、中英双语、针对大语言模型长文本理解能力的评测基准）测试中，360 选择其中与中文长文本应用最密切相关的中文单文档问答、多文档问答、摘要、Few-shot 等任务进行评测，360Zhinao-7B-Chat-32K 模型取得了平均分第一的成绩。

360 智脑 7B 参数大模型开源，支持 50 万字长文本输入

在英文大海捞针测试（NeedleInAHaystack，是将关键信息插入一段长文本的不同位置，再对该关键信息提问，从而测试大模型的长文本能力的一种方法）中，360Zhinao-7B-Chat-360K 达到 98% 以上的准确率。360 仿照 SuperCLUE-200K 测评基准构造了中文大海捞针测试，同样做到了 98% 以上的准确率。

除模型权重外，该模型的微调训练代码，推理代码等全套工具集也被一并开源，大模型相关开发者可做到“开箱即用”。

周鸿祎曾表示，前段时间大模型行业卷文本长度，100 万字“很快将是标配”。“我们打算将这个能力开源，大家没必要重复造轮子，定为 360K 主要是为了讨个口彩。”他还自称“开源的信徒”，信奉开源的力量。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

360 智脑 7B 参数大模型开源，支持 50 万字长文本输入

福布斯发布人工智能50强榜单 OpenAI、Anthropic等霸榜

华为哈勃首次投资国内 AI大模型公司：面壁智能完成数亿元融资，知乎 CTO 李大海担任 CEO

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

福布斯发布人工智能50强榜单 OpenAI、Anthropic等霸榜

华为哈勃首次投资国内 AI大模型公司：面壁智能完成数亿元融资，知乎 CTO 李大海担任 CEO

开源大模型联盟！甲骨文、英特尔、Meta等57家组织参与

昆仑万维宣布 4 月 17 日发布并开源“天工大模型 3.0”：4000 亿参数，号称性能超 Grok 1.0

元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用

“要把大模型拉下神坛”，周鸿祎宣布 360 安全大模型免费

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

元象发布 XVERSE-MoE-A4.2B 大模型可免费商用