如今,人们只需敲敲键盘,就可以让 AI 写作工具帮忙代写论文、创作说唱歌曲或编写剧本。然而就目前来说,人类仍然不能指望它具备“莎士比亚式的原创性”。根据 Science 的报道,一项新研究表明,这些 AI 作品至少在目前仍带有明显的衍生色彩。
为了验证这一观点,研究人员开发了一款能够衡量 AI 创造力的程序。伦敦大学学院研究 AI 创意性的计算机科学家 Mirco Musolesi 指出,评估创造力是“一个复杂且有趣的挑战”,并认为这一新方法在解决语言新颖性问题这一方面表现出色。
自生成式 AI 和大语言模型问世以来,科学界对其创作能力一直存在质疑。尽管这些 AI 可以快速生成看似人类创作的文字,但部分学者认为其并未真正创新,只是简单地重组训练语料中的内容。批评者将其比作“随机鹦鹉”(注:盲目重复已知文本)。
然而量化这种创造力并非易事。科学家通常采取两种方法:一是用计算机检测抄袭迹象 —— 但“无抄袭”不代表“原创性”;二是让人类评分评估流畅性和原创性 —— 但这一过程主观且耗时。
对此,华盛顿大学的计算机科学家 Lu Ximing 和团队开发了一款名为 DJ Search 的工具。它既具备客观性,又能捕捉细微差异。该工具从 AI 输出文本中提取短语片段,并在数据库中查找相似内容。它不仅寻找完全匹配,还会识别语义相近的表达。借助 AI 算法分析词义,它通过嵌入向量判断同义词。最终,其通过计算未匹配部分在文本中的占比来评估 AI 输出的新颖性。
研究发现,人类在诗歌、小说和演讲领域的表现明显优于 AI,分别高出 80%、100% 和 150%。
DJ Search 还可以比较人类作品,例如《饥饿游戏》的语言原创性比《暮光之城》高 35%。研究负责人 Lu 将 AI 类比为 DJ:“它们像 DJ 混音音乐一样拼接文本,尽管精彩,却无法取代作曲家。”
加州大学洛杉矶分校的计算机科学家 Nanyun Violet Peng 建议,未来应评估整体叙事的原创性,而非仅限于语言层面。