OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

Meta最近发布了新一代开源模型系列Llama3.1，其中包括一个405B参数的版本，其性能接近甚至在某些基准测试中超越了GPT-4等闭源模型。Llama3.1-8B-Instruct是该系列中的一个8B参数版本，支持英语、德语、法语、意大利语、葡萄牙语、西班牙语、印地语和泰语，上下文长度高达131072tokens，知识截止日期更新至2023年12月。

为了增强Llama3.1-8B-Instruct的能力，Meta在训练中使用了超过2500万条合成数据，这些数据由更大的405B模型生成。这使得Llama3.1-8B-Instruct在代码、数学等测试中表现出与GPT3.5Turbo相近的认知和推理能力。

OpenBuddy利用Llama3.1-8B-Instruct模型，通过在少量中文数据上进行训练，发布了OpenBuddy-Llama3.1-8B-v22.1-131K，这是一个具备中文问答和跨语言翻译能力的新一代开源跨语言模型。尽管Llama3.1本身不具备中文能力，但经过训练后，该模型在一些容易产生概念混淆的问题上能够生成通常只有更大模型才能生成的答案，显示出更强的认知潜力。

然而，由于训练数据集和时间的限制，OpenBuddy-Llama3.1-8B-v22.1在中文知识，特别是传统文化知识上仍存在局限。尽管如此，模型在长文理解等任务上表现出相对稳定的表现，这得益于其原本的长文能力。

未来，OpenBuddy计划对8B和70B模型进行更大规模的训练，以增强模型的中文知识储备、长文能力和认知能力，并探索微调405B模型的可能性。

项目地址：https://modelscope.cn/models/OpenBuddy/openbuddy-llama3.1-8b-v22.1-131k

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

1230 亿参数，Mistral 发布 Large 2 旗舰 AI 模型：支持 80 多种编程语言，增强代码生成、数学和推理能力

腾讯智影PC端推出“智能画布”功能支持再创作、抠图、消除、扩图等

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

1230 亿参数，Mistral 发布 Large 2 旗舰 AI 模型：支持 80 多种编程语言，增强代码生成、数学和推理能力

腾讯智影PC端推出“智能画布”功能 支持再创作、抠图、消除、扩图等

震惊AI界！Llama 3.1泄露：4050亿参数的开源巨兽来袭！

​迷你AI模型TinyLlama发布：高性能、仅637MB

阿里通义千问开源Qwen1.5-MoE-A2.7B模型

DeepSeek开源DeepSeek-V2-Chat-0628模型 代码、数学推理能力提升

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

腾讯智影PC端推出“智能画布”功能支持再创作、抠图、消除、扩图等

迷你AI模型TinyLlama发布：高性能、仅637MB

DeepSeek开源DeepSeek-V2-Chat-0628模型代码、数学推理能力提升