-
可实时识别屏幕内容,谷歌 Gemini Live 功能向所有安卓用户免费开放
4 月 17 日消息,谷歌今日宣布,其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。该功能能够实时识别并回应关于用户手机摄像头和屏幕上的内容,本月早些时候为所有 Pixel 9 和三星 Galaxy S25 用户推出,并且需要通过 Gemini Advanced 订阅才能使用。然而,谷歌在收到用户对 Gemini Live 功能的积极反馈后,决定改变策略,将其免费…- 147
-
谷歌 Veo 2 视频生成模型入驻 Gemini,用户可创建 8 秒 720p 视频
4 月 16 日消息,谷歌宣布将旗下的 Veo 2 视频生成 AI 模型带给 Gemini Advanced 订阅用户。这一举措旨在应对 OpenAI 的 Sora 视频生成平台的竞争,并在日益激烈的市场中占据一席之地。就在两周前,合成媒体领域的强劲对手 Runway 发布了其第四代视频生成器,并成功筹集了超过 3 亿美元(注:现汇率约合 21.93 亿元人民币)的新资金。 从本周二开始,Gemi…- 455
-
谷歌 DeepMind 开发 DolphinGemma AI模型,助力海豚“语言”研究
4 月 15 日消息,谷歌旗下的 AI 研究实验室谷歌 DeepMind 今日宣布,成功开发出一款名为 DolphinGemma 的 AI 模型,旨在助力科学家深入研究海豚的“语言”,更好地理解海豚的沟通方式。 据1AI了解,DolphinGemma 是基于谷歌开放的 Gemma 系列模型构建的,其训练数据来源于专注于研究大西洋斑点海豚及其行为的非营利组织 Wild Dolphin Project…- 481
-
谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI助手
谷歌 DeepMind 首席执行官 Demis Hassabis 在由领英联合创始人 Reid Hoffman 共同主持的播客节目 Possible 中透露,谷歌计划将旗下的 Gemini AI 模型与 Veo 视频生成模型进行融合,以此提升 Gemini 对物理世界的理解能力。 Hassabis 表示:“我们从一开始就将 Gemini 这一基础模型打造为多模态模型,因为我们有着构建一个通用数字助…- 364
-
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
4 月 12 日消息,科技媒体 Android Authority 昨日(4 月 11 日)发布博文,报道称谷歌计划发布 Circle Screen 功能,支持用户圈选屏幕部分内容,实现精准搜索。 谷歌近期在 Instagram 上发布了一段展示 Gemini 屏幕共享功能的视频,意外透露了一项未公开的“Circle Screen (DF)”选项。据推测,“DF”代表“DogFood”,即谷歌内部…- 1.2k
-
谷歌进军“AI影视圈”野心大:推出专项计划鼓励制作人机关系主题影片
4 月 11 日消息,据外媒 Neowin 10 日报道,谷歌提出了一项新计划“AI on Screen”:将 AI 与影视创作相结合,将支持创作者制作短片,探讨人类与 AI 的关系。 谷歌宣布将与 Range Media 联合启动该计划,邀请具有远见的电影人创作原创叙事作品,深入呈现人类与 AI 之间复杂的互动。 AI 并非影视题材中的新鲜事。从 1927 年德国科幻片《大都会》起,电影人就开始…- 771
-
谷歌 Veo 2 升级可生成更具电影感视频,文本、音频 AI 同步升级
4 月 10 日消息,谷歌为其视频AI模型 Veo 2 推出新功能,旨在帮助用户更轻松地生成具有电影质感的画面以及编辑真实视频。这些新增的 Veo 2 功能目前可通过谷歌云的 Vertex AI 平台进行预览,与此同时,谷歌还对文本转图像生成器 Imagen 3 以及音频相关 AI 模型进行了更新。 据1AI了解,Veo 2 的新功能包括修复功能(inpainting)和外扩功能(outpaint…- 626
-
谷歌推出 Vertex AI Media Studio 文生视频套件:自动化包办画面渲染、旁白、配乐等
4 月 10 日消息,谷歌今天(4 月 10 日)推出 Vertex AI Media Studio 平台,该套件支持文本指令生成完整视频内容。 该平台整合 Imagen 3 图像生成、Veo 2 视频制作、Chirp 语音合成及 Lyria 背景音乐四大核心模型,用户无需编码或剪辑经验,即可在统一界面完成全流程创作。 谷歌近日宣布推出 Vertex AI Media Studio,这是一组基于 …- 648
-
谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能,可多步骤完成复杂任务
4 月 10 日消息,在本周三的谷歌 Cloud Next 大会上,谷歌宣布其 AI编程助手 Gemini Code Assist 新增“代理”功能。 谷歌表示,Code Assist 如今能够部署新的 AI“代理”,这些代理能够通过多步骤完成复杂的编程任务。例如,它们可以根据 Google Docs 中的产品规格创建应用程序,或者将代码从一种语言转换为另一种语言。此外,Code Assist 现…- 880
-
继 OpenAI 后,谷歌 Gemini 模型将支持 Anthropic 的 MCP 协议
4 月 10 日消息,在 OpenAI 宣布将采用竞争对手 Anthropic 的 AI 模型连接数据系统标准后,谷歌也迅速跟进。 谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)本周三在 X 平台上发布消息,称谷歌将为其 Gemini 模型和软件开发工具包(SDK)添加对 Anthropic 的模型上下文协议(Model Context Protocol,MCP…- 577
-
谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生
4 月 10 日消息,谷歌今日推出了一款名为 Gemini 2.5 Flash 的全新 AI模型,该模型注重高效能,并提供强劲的性能。 据1AI了解,Gemini 2.5 Flash 即将登陆谷歌的 AI 开发平台 Vertex AI。谷歌公司表示,该模型具备“动态且可控”的计算能力,开发者能够根据查询请求的复杂程度灵活调整处理时间。谷歌在一篇博客文章中写道:“你可以针对特定需求来调整速度、准确性…- 299
-
谷歌重申今年 750 亿美元资本支出计划:斥巨资购买芯片、服务器,持续押注生成式 AI
4 月 10 日消息,据路透社报道,谷歌母公司 Alphabet 公司周三重申,计划今年投入约 750 亿美元(注:现汇率约合 5519.45 亿元人民币)扩建数据中心,继续押注生成式 AI,尽管回报尚不明朗,且全球贸易战可能带来成本上升的压力。 Alphabet 首席执行官桑达尔・皮查伊在谷歌云计算部门的年度会议上表示,这项投资将用于采购所需的芯片和服务器,强化公司核心业务(如搜索),同时推动 …- 114
-
谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等 8 种视频格式
4 月 8 日消息,科技媒体 Android Authority 今天(4 月 8 日)发布博文,通过分析 APK 文件,发现谷歌 Gemini 即将升级文件分析功能,新增支持 3GP、AVI、FLV 等 8 种视频格式。 Gemini 现有文件分析功能支持文档、代码、表格等类型,但暂不支持视频处理。该媒体分析 Google App 16.13.38 测试版代码,发现 Gemini 该功能将兼容 …- 3k
-
谷歌 AI 模式新增多模态搜索,支持图像提问功能
4 月 8 日消息,谷歌正在为其谷歌搜索实验项目“AI 模式”引入多模态搜索功能。AI 模式允许用户提出复杂且包含多个部分的问题,并通过追问深入探索相关主题。如今,拥有 AI 模式访问权限的用户可以点击该功能,针对他们上传的照片或使用相机拍摄的照片提出问题。 1AI注意到,谷歌在本周一的博客文章中表示,AI 模式中的新图像分析功能由 Google Lens 的多模态能力提供支持。据谷歌介绍,AI …- 1.6k
-
消息称谷歌付钱让部分 AI 员工赋闲一年,以防其投奔竞争对手
4 月 8 日消息,在人工智能领域,谷歌、OpenAI 以及其他科技巨头之间的竞争愈发激烈,留住顶尖人工智能人才成为了一大挑战。据 Business Insider 报道,谷歌旗下的人工智能部门 DeepMind,为防止员工流向竞争对手,竟采取了一种“激进”的竞业禁止协议。 这种协议规定,部分在英国的员工在离职后一年内不得为竞争对手工作。在此期间,虽然员工无需工作,但 DeepMind 仍会支付他…- 897
-
谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能
4 月 8 日消息,谷歌宣布旗下 Gemini Live AI“Live Camera(实时拍摄)”及“Screenshare(识图导购)”功能现已支持 Pixel 9 系列手机和三星 Galaxy S25。之后还将支持更多安卓设备,不过只有付费的 Gemini Advanced 用户才能使用这些新功能。 在启用“Live Camera”功能后,用户只需按下一个按钮即可激活“实时拍摄”功能,并向 …- 345
-
谷歌迄今最贵 AI模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起
4 月 5 日消息,当地时间周五,谷歌公布了 Gemini 2.5 Pro 的 API 定价。对于最多 200000 个 tokens 的输入,Gemini 2.5 Pro 的费用为每百万输入 tokens 1.25 美元(注:现汇率约合 9.1 元人民币,大约 750000 个单词),每百万输出 tokens 为 10 美元(现汇率约合 72.9 元人民币)。 而对于超过 200000 个 to…- 1.9k
-
谷歌拉响通用人工智能警报,首次公开 AI 安全防御蓝图
4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。 DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。 谷歌 DeepMind…- 1.8k
-
谷歌 AI笔记应用 NotebookLM 新增“发现资料”功能,可自动检索相关网络资源
4 月 3 日消息,谷歌旗下的人工智能笔记应用 NotebookLM 推出了一项令人眼前一亮的新功能 ——“发现资料”(Discover sources),这一功能的上线有望极大地提升学生和研究人员在资料收集方面的效率。 以往,用户在使用 NotebookLM 时,需要手动添加 PDF 文件、谷歌文档或幻灯片、网站链接、YouTube 视频链接或粘贴文本等资料,才能使用该应用的诸如音频概览(Aud…- 609
-
代码显示谷歌正在开发儿童版 Gemini:能编故事,还能辅导作业
4 月 2 日消息,外媒 Android Authority 今日发布消息称,在对 Android 版谷歌应用(16.12.39 版本)进行拆解分析时,发现了多个代码字符串,其中均提到了“儿童用户”。 其中一条字符串透露了儿童版 Gemini 的主要用途,包括讲故事、解答问题和辅导作业(注:现有的 Gemini 也具备这些能力)。不过,谷歌在 Gemini 的安全页面上提到,该 AI 针对青少年用…- 704
-
“迄今最智能”AI模型登场,谷歌 Gemini 2.5 Pro 免费向公众推出
3 月 30 日消息,谷歌今日宣布,最新的 Gemini AI 旗舰模型 Gemini 2.5 Pro 将免费向所有 Gemini 应用用户开放。此前,该实验性模型仅限于 Gemini Advanced 订阅用户使用。 谷歌本周早些时候发布了 Gemini 2.5 Pro,并称其为迄今“最智能的 AI 模型”,在推理能力上较前代版本进一步增强。新版模型支持多项功能,包括应用和浏览器扩展、文件上传,…- 1.5k
-
为避免内耗:谷歌 AI 助手 Pixie 项目遭拆分,部分能力并入 Gemini
3 月 26 日消息,科技媒体 The Information 今天(3 月 26 日)发布博文,报道称谷歌公司为避免和 Gemini 竞争,拆分 Pixie 项目,一部分转化为 Pixel 手机的“截图应用”,另一部分融入 Gemini 功能。 1AI曾于 2023 年 12 月报道,谷歌计划为 Pixel 9 系列手机,开发一款全新的 AI 助手,它基于自家的 Gemini Nano 模型,将…- 1.8k
-
谷歌正在推出 Gemini 实时人工智能视频功能
3 月 24 日消息,谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实,谷歌已开始向 Gemini Live 推出新的人工智能功能,这些功能使其能够“看到”你的屏幕内容,或者通过你的智能手机摄像头获取画面,并实时回答与之相关的问题。这些功能是在谷歌首次展示为其提供技术支持的“阿斯特拉项目”(Project Astra)近一年后推出的。 1AI注意到,谷歌公司在去年 5 月召…- 2.2k
-
谷歌 Gemini 新增 Canvas 与音频概览功能,提升用户生产力
3 月 19 日消息,谷歌在其 AI 驱动的 Gemini 聊天机器人中新增了一项名为 Canvas(画布)的功能,标志着谷歌在将聊天机器人平台转变为全面生产力套件的道路上又迈出了重要一步。 Canvas 与 OpenAI 的 ChatGPT Canvas 工具以及 Anthropic 的 Artifacts 在概念上相似,它为 Gemini 用户提供了一个互动空间,用户可以在其中创建、完善并分享…- 729