4月11
-
全面突围,谷歌更新了一大波大模型产品
10:02谷歌在Google’s Cloud Next 2024上发布了一系列AI相关的模型更新和产品,包括Gemini 1.5 Pro首次提供了本地音频(语音)理解功能、代码生成新模型CodeGemma、首款自研Arm处理器Axion等等。(机器之心)
4月08
-
谷歌考虑对人工智能搜索收费,或将是谷歌商业模式的重大改变
09:424 月 7 日,据《金融时报》报道,谷歌正考虑对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务有史以来最大的一次变革。多年来谷歌一直提供完全由广告资助的免费消费者服务,对其搜索引擎的拟议改革将标志着谷歌首次将其核心产品都置于「付费墙」之后。 据三名了解谷歌计划的人士透露,谷歌正在考虑的选项包括在高级订阅服务中添加某些人工智能搜索功能。其中一位知情人士表示,工程师们正在开发部署这项服务所需…
3月30
-
微软与 OpenAI 计划投资 1000 亿美元开发 AI 超级计算机
09:10据科技媒体《The Information》援引消息人士信息称,微软和 OpenAI 正密切规划一个雄心勃勃的数据中心项目,旨在建造一台名为「星际门」(Stargate)的 AI 超级计算机。该计算机将配备数百万个专用服务器芯片,旨在为 OpenAI 的 AI 技术提供强大动力。 据悉,该项目预计耗资高达 1000 亿美元,这是目前一些最大数据中心成本的 100 倍。微软将承担项目的资金投入,展现…
3月29
-
谷歌:AI图像插入新“神器”
11:33谷歌研究人员发布论文,介绍ObjectDrop Bootstrapping Counterfactuals的方法,用于实现真实感对象的移除和插入。面对扩散模型经常生成违反物理定律的图像的问题,这种方法能够支持逼真的对象插入,使得遮挡、阴影和反射等效果更加真实。 论文地址: https://arxiv.org/pdf/2403.18818.pdf
-
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
11:30谷歌与南加州大学开发的“SELF-DISCOVER”框架,能让大语言模型自行发现和解决复杂推理问题。在多个复杂推理测试中,该框架带来了高达42%的性能提升,显著优于传统的链式思维方法。SELF-DISCOVER通过整合多个推理模块、提高效率、并反映任务内在特性,特别在需要世界知识的任务上表现出色。(AIGC开放社区)
3月28
-
谷歌推出能制作旅行攻略的AI工具
10:30当地时间周三,谷歌发布公告,预披露了一项能通过自然语言对话,帮助用户生成旅行行程和出游建议的AI功能。谷歌透露,在这个AI行程功能背后,涵盖了超过2亿个全球地点的数据,汇聚了整个互联网的各种想法,以及用户向谷歌提交的评论、照片、商业资料详情等数据。目前该功能只有美国地区的内测用户可以试用。
3月25
3月22
-
谷歌再吃罚单,法国指其聊天机器人侵犯版权
10:01法国市场监管机构3月20日宣布,已向美国谷歌公司开出一张2.5亿欧元(约合2.72亿美元)的新罚单,原因是谷歌未经同意使用法国出版商和新闻机构的内容训练聊天机器人“巴德”(其升级版名为“双子座”),违反欧洲联盟知识产权相关法规。
3月21
-
谷歌推出AI足球教练TacticAI
10:04谷歌推出TacticAI足球战术AI助手。系统能够通过预测和生成式AI为专家提供战术见解,尤其在角球方面表现出色。谷歌与利物浦足球俱乐部合作评估后发现,TacticAI的建议在90%的情况下受到人类专家评价者的认可。成果已发表在Nature Communications的Nature子刊上。 论文地址: https://www.nature.com/articles/s41467-024-4596…
3月15
-
谷歌提出VLOGGER,生成逼真的会说话和会移动的人类口播视频
09:52VLOGGER 通过音频或文本输入,结合单个图像,生成包含面部和身体动作的逼真人类视频,采用随机扩散模型和三维人体姿态表示;引入新的大规模多样化数据集MENTOR,提供三维姿势和表情注释,支持VLOGGER训练,使其在身份和时长方面成为最大的数据集;VLOGGER在多个公共基准测试上超越最先进方法,展现出在图像质量、身份保留和时间一致性上的优势,同时验证了其在不同多样性维度上的稳健性。(AI妙妙房…
-
智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏
09:51谷歌DeepMind开发出一款名为SIMA的 AI 智能体,它是一种适用于3D虚拟环境的通用AI。SIMA可以理解自然语言指令,并能够在不同的游戏世界中执行任务。研究表明SIMA在九款不同3D游戏中的表现优于专业智能体,显示出跨游戏的强泛化能力。然而,SIMA目前还未能达到人类水平。(机器之心)
3月14
-
亚马逊和 Google 悄悄降低对生成式 AI 的预期
09:45The Information 独家报道,有几家提供云服务和 AI 服务技术支持的公司正在向销售团队调整预期,强调目前对生成式 AI 技术的炒作超出了其实际功能。微软、亚马逊和 Google 等主要几家云提供商的高层、产品经理和销售人员也私下表示,鉴于 AI 服务的高昂价格,他们大多数客户对新 AI 技术的投资持谨慎态度,担心成本的高昂、准确性上的不足以及技术价值评估的难度。有专家指出,尽管生成式…
3月11
-
谷歌MediaPipe LLM Inference API:实现手机PC大模型端侧运行
10:30谷歌发布了MediaPipe LLM Inference API,该API使开发人员能够更轻松地在手机、PC等设备上本地运行AI大型模型。谷歌对跨设备堆栈进行了重点优化,包括新的操作、量化、缓存和权重共享。目前,MediaPipe已经支持了四种模型:Gemma、Phi 2、Falcon和Stable LM,这些模型可以在网页、安卓和iOS设备上运行。谷歌计划将这一功能扩展到更多平台上。 demo地…
3月07
-
谷歌搜索将打击AI生成的垃圾内容
10:013月5日,谷歌宣布将对其搜索排名系统进行一些新的更改,将减少垃圾信息、低质量内容的搜索结果。谷歌搜索副总裁潘杜·纳亚克(Pandu Nayak)提到,对于每天通过低薪承包商或AI生成器创建的低质量文章,谷歌正在考虑降低其搜索排名。
3月05
-
谷歌预计其更先进的大模型明年将嵌入安卓手机
10:05谷歌对人工智能大模型应用于智能手机的前景充满乐观。谷歌Pixel部门产品管理副总裁布莱恩·拉科夫斯基(Brian Rakowski)日前预计,谷歌更先进的Gemini大模型明年将嵌入智能手机。(澎湃新闻)
-
谷歌提出RNN新架构RG-LRU
10:04谷歌的研究人员提出了一种名为RG-LRU层的新型门控线性循环层,并围绕该层设计了一个新的循环块,用以替代多查询注意力(MQA)。他们利用这一循环块构建了两个新模型:一个是结合了MLP和循环块的模型Hawk,另一个是结合了MLP、循环块和局部注意力的模型Griffin。通过在300B tokens上对Hawk和Griffin进行过度训练,并针对一系列不同模型规模,研究发现Hawk-3B在下游任务的性…
3月04
-
谷歌新架构两连发:同等规模强于Mamba
10:24谷歌DeepMind推出新架构Hawk和Griffin,挑战传统Transformer模型,展示RNN在AI领域的新潜力。Hawk和Griffin模型在同等规模下展现出优于Mamba的性能,证明了它们在处理效率和下游任务性能上的竞争力。这两个模型实现了与Transformer相当的训练效率,并在推理过程中提供更高的吞吐量和更低的延迟,尤其在处理长序列数据时性能更佳。
2月29
-
谷歌AI模型屡次“翻车”,CEO内部反思:这样错误完全不可接受
09:49谷歌CEO皮查伊应对Gemini图像生成功能引发的种族争议,承诺采取结构性改革。此前,因工具的问题性结果,谷歌暂停了该功能,皮查伊表示偏见和冒犯用户是不可接受的错误,并已取得防护措施进展。(腾讯科技)
2月28
-
谷歌:宣布Message集成Gemini
09:50在2024年世界移动通信大会上,谷歌宣布Gemini将与Messages集成。这意味着用户可以在安卓手机上的Google Messages中直接访问Gemini,与Gemini进行聊天、起草消息等操作,而无需离开该应用程序。
-
谷歌发布AI基础世界模型Genie,一张图可生成一个交互式世界
09:48谷歌发布了110亿参数的全新AI基础世界模型。仅用一张图片,便可生成一个交互式世界,生成的世界“动作可控”,用户可以其中逐帧行动。谷歌将该模型命名为Genie(生成式交互环境,Genie一词中文意为“精灵”)。谷歌表示,Genie开启了“图/文生成交互世界”的时代,还将成为实现通用AI Agent的催化剂。