微软推出“从错误中学习”模型训练法

微软亚洲研究院联合北京大学、西安交通大学等高校提出了一项名为“从错误中学习(LeMA)”的AI训练方法,旨在通过模仿人类学习过程来改进AI的推理能力。该方法通过使用包含错误解答和修正后正确答案的数据来微调模型。研究人员采用GSM8K和MATH测试了LeMA训练法对5个开源大模型的效果,显示在GSM8K和MATH任务中,改进后的LLaMA-2-70B分别达到了83.5%和81.4%的准确率。

搜索