用AI生成的数据训练AI,模型会崩溃?最新Nature封面

使用AI生成的数据训练新的AI模型导致了“模型崩溃”,表现为生成内容的质量逐代下降,最终导致输出无意义的信息;牛津、剑桥等机构的研究发现,合成数据的使用类似于近亲繁殖,会导致数据质量低下,建议更多使用人类数据以避免这种情况;研究强调,为防止AI模型退化,应在训练数据中保持一定比例的原始数据,并探索更鲁棒的训练算法。

搜索