华盛顿大学推高效大模型调优方法“代理调优”

华盛顿大学推出更高效的大模型调优方法“代理调优”，该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测，实现对模型的调优而无需接触模型的内部权重。

随着ChatGPT等生成式AI产品的发展，基础模型的参数不断增加，因此进行权重调优需要耗费大量时间和算力。为提升调优效率，该方法可以在解码时更好地保留训练知识，同时保留更大规模预训练的优势。研究人员对LlAMA-2的13B、70B原始模型进行了微调，结果显示代理调优的性能比直接调优的模型更高。

论文地址:https://arxiv.org/pdf/2401.08565.pdf

该方法需要准备一个小型的预训练语言模型M-，与基础模型M共享相同的词汇表，然后使用训练数据对M-进行调优得到调优模型M+。

在解码时，通过对比基础模型M的输出预测分布和调优模型M+的输出预测分布之间的差异，来引导基础模型的预测，最后将预测差异应用于基础模型的预测结果，以引导基础模型的预测朝向调优模型的预测方向移动。这一方法与大模型中的“蒸馏”技术恰恰相反，是一种创新性的调优方法。

代理调优方法的推出，为大模型的调优提供了更高效的解决方案，同时也可以在解码时更好地保留训练知识，使得模型的性能更高。这一方法的推出将为AI领域的发展带来新的启示，值得进一步深入研究和应用。

声明：内容均采集自公开的网站等各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

华盛顿大学推高效大模型调优方法“代理调优”

谷歌取消与AI数据公司Appen的合同，曾帮助训练Bard等产品

三星S24手机搭载AI模型：AI大模型应用越来越广泛

AI微博

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

谷歌取消与AI数据公司Appen的合同，曾帮助训练Bard等产品

三星S24手机搭载AI模型：AI大模型应用越来越广泛

周鸿祎分享2024年大模型发展趋势的十大预测：将出现杀手级应用

大模型开山鼻祖！InstructGPT发布两周年了

理想汽车 Mind GPT 多模态认知大模型通过国家备案

智谱发布并开源代码生成大模型 CodeGeeX 第四代，号称百亿以下规模性能最强

AI应用

5000+AI应用！每日更新

AIAICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注