Google 版 o1 重磅推出

今天凌晨,Google 重磅推出了 Gemini 2.0 Flash Thinking 模型。新的 Thinking 模型支持多模态推理,使用类似 o1 模型的慢思维思考方式,可以深度可视化展示整个思维链过程,尤其是在执行数学、编程等复杂问题方面,能持续输出全部推理过程,而不是直接给出答案。据悉,在大模型排行榜 LMSYS 上,所有综合类别指标中显示,目前 Gemini 2.0 Flash Thinking 排名第一,包括数学、代码、指令跟随、长 QA、创意写作等等各方面。目前在Google AI Studio 就可以免费使用 Gemini 2.0 Flash Thinking。此外,近日据 TechCrunch 报道,Google 针对其大型语言模型 Gemini 回复内容的外包审核流程进行了一项调整,引发了外界对其在敏感领域信息准确性的担忧。此项调整要求外包人员审核流程不再像以往那样,因自身专业知识不足而跳过某些特定的审核任务,这或将导致  Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。为改进 Gemini,Google 与其外包公司日立旗下的 GlobalLogic 合作,由后者雇佣的合同工负责审核人工智能生成的回复,审核标准包括「真实性」等因素。此前,如果审核员认为某个问题超出了自身专业领域,例如一个关于心脏病学的专业问题,而审核员本身并无相关科学背景,他们可以选择「跳过」该回应,并避免审核该回应内容。

搜索