-
谷歌 Veo 2 视频生成模型入驻 Gemini,用户可创建 8 秒 720p 视频
4 月 16 日消息,谷歌宣布将旗下的 Veo 2 视频生成 AI 模型带给 Gemini Advanced 订阅用户。这一举措旨在应对 OpenAI 的 Sora 视频生成平台的竞争,并在日益激烈的市场中占据一席之地。就在两周前,合成媒体领域的强劲对手 Runway 发布了其第四代视频生成器,并成功筹集了超过 3 亿美元(注:现汇率约合 21.93 亿元人民币)的新资金。 从本周二开始,Gemi…- 321
-
谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI助手
谷歌 DeepMind 首席执行官 Demis Hassabis 在由领英联合创始人 Reid Hoffman 共同主持的播客节目 Possible 中透露,谷歌计划将旗下的 Gemini AI 模型与 Veo 视频生成模型进行融合,以此提升 Gemini 对物理世界的理解能力。 Hassabis 表示:“我们从一开始就将 Gemini 这一基础模型打造为多模态模型,因为我们有着构建一个通用数字助…- 364
-
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
4 月 12 日消息,科技媒体 Android Authority 昨日(4 月 11 日)发布博文,报道称谷歌计划发布 Circle Screen 功能,支持用户圈选屏幕部分内容,实现精准搜索。 谷歌近期在 Instagram 上发布了一段展示 Gemini 屏幕共享功能的视频,意外透露了一项未公开的“Circle Screen (DF)”选项。据推测,“DF”代表“DogFood”,即谷歌内部…- 1.1k
-
继 OpenAI 后,谷歌 Gemini 模型将支持 Anthropic 的 MCP 协议
4 月 10 日消息,在 OpenAI 宣布将采用竞争对手 Anthropic 的 AI 模型连接数据系统标准后,谷歌也迅速跟进。 谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)本周三在 X 平台上发布消息,称谷歌将为其 Gemini 模型和软件开发工具包(SDK)添加对 Anthropic 的模型上下文协议(Model Context Protocol,MCP…- 577
-
谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生
4 月 10 日消息,谷歌今日推出了一款名为 Gemini 2.5 Flash 的全新 AI模型,该模型注重高效能,并提供强劲的性能。 据1AI了解,Gemini 2.5 Flash 即将登陆谷歌的 AI 开发平台 Vertex AI。谷歌公司表示,该模型具备“动态且可控”的计算能力,开发者能够根据查询请求的复杂程度灵活调整处理时间。谷歌在一篇博客文章中写道:“你可以针对特定需求来调整速度、准确性…- 299
-
谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等 8 种视频格式
4 月 8 日消息,科技媒体 Android Authority 今天(4 月 8 日)发布博文,通过分析 APK 文件,发现谷歌 Gemini 即将升级文件分析功能,新增支持 3GP、AVI、FLV 等 8 种视频格式。 Gemini 现有文件分析功能支持文档、代码、表格等类型,但暂不支持视频处理。该媒体分析 Google App 16.13.38 测试版代码,发现 Gemini 该功能将兼容 …- 3k
-
谷歌迄今最贵 AI模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起
4 月 5 日消息,当地时间周五,谷歌公布了 Gemini 2.5 Pro 的 API 定价。对于最多 200000 个 tokens 的输入,Gemini 2.5 Pro 的费用为每百万输入 tokens 1.25 美元(注:现汇率约合 9.1 元人民币,大约 750000 个单词),每百万输出 tokens 为 10 美元(现汇率约合 72.9 元人民币)。 而对于超过 200000 个 to…- 1.8k
-
代码显示谷歌正在开发儿童版 Gemini:能编故事,还能辅导作业
4 月 2 日消息,外媒 Android Authority 今日发布消息称,在对 Android 版谷歌应用(16.12.39 版本)进行拆解分析时,发现了多个代码字符串,其中均提到了“儿童用户”。 其中一条字符串透露了儿童版 Gemini 的主要用途,包括讲故事、解答问题和辅导作业(注:现有的 Gemini 也具备这些能力)。不过,谷歌在 Gemini 的安全页面上提到,该 AI 针对青少年用…- 607
-
“迄今最智能”AI模型登场,谷歌 Gemini 2.5 Pro 免费向公众推出
3 月 30 日消息,谷歌今日宣布,最新的 Gemini AI 旗舰模型 Gemini 2.5 Pro 将免费向所有 Gemini 应用用户开放。此前,该实验性模型仅限于 Gemini Advanced 订阅用户使用。 谷歌本周早些时候发布了 Gemini 2.5 Pro,并称其为迄今“最智能的 AI 模型”,在推理能力上较前代版本进一步增强。新版模型支持多项功能,包括应用和浏览器扩展、文件上传,…- 1.5k
-
为避免内耗:谷歌 AI 助手 Pixie 项目遭拆分,部分能力并入 Gemini
3 月 26 日消息,科技媒体 The Information 今天(3 月 26 日)发布博文,报道称谷歌公司为避免和 Gemini 竞争,拆分 Pixie 项目,一部分转化为 Pixel 手机的“截图应用”,另一部分融入 Gemini 功能。 1AI曾于 2023 年 12 月报道,谷歌计划为 Pixel 9 系列手机,开发一款全新的 AI 助手,它基于自家的 Gemini Nano 模型,将…- 1.8k
-
谷歌正在推出 Gemini 实时人工智能视频功能
3 月 24 日消息,谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实,谷歌已开始向 Gemini Live 推出新的人工智能功能,这些功能使其能够“看到”你的屏幕内容,或者通过你的智能手机摄像头获取画面,并实时回答与之相关的问题。这些功能是在谷歌首次展示为其提供技术支持的“阿斯特拉项目”(Project Astra)近一年后推出的。 1AI注意到,谷歌公司在去年 5 月召…- 2.2k
-
谷歌 Gemini 新增 Canvas 与音频概览功能,提升用户生产力
3 月 19 日消息,谷歌在其 AI 驱动的 Gemini 聊天机器人中新增了一项名为 Canvas(画布)的功能,标志着谷歌在将聊天机器人平台转变为全面生产力套件的道路上又迈出了重要一步。 Canvas 与 OpenAI 的 ChatGPT Canvas 工具以及 Anthropic 的 Artifacts 在概念上相似,它为 Gemini 用户提供了一个互动空间,用户可以在其中创建、完善并分享…- 729
-
用AI搞定短剧、短片、短视频创作,Gemini教你用一张图直接生成分镜教程
最近谷歌发布了Gemini 2.0 Flash的图像生成模型,可以通过自然语言与AI沟通,达成各种生图功能。 一、使用方法 目前可以通过谷歌Ai Studio登录,免费使用(需要畅通的网络): 登录之后在模型下拉菜单中,选择Gemini 2.0 Flash (Image Generation) Experimental即可: 二、实测 1、局部重绘+风格重绘 首先文生图,并要求AI对人物换装(局部…- 2.7k
-
谷歌升级 Gemini 2.0 系列模型,AI助手可免费深度推理
3 月 18 日消息,谷歌公司昨日(3 月 17 日)发布博文,宣布通过升级 Gemini 2.0 模型,推出“AI Overviews”和“AI Mode”功能,让传统搜索插上 AI 翅膀。 谷歌本次部署推出了 2.0 Flash、2.0 Pro 及 Personalisation 三个实验性模型,覆盖安卓、iOS 和网页端,并免费同步开放 AI 助手的 Deep Research 深度推理功能…- 2.4k
-
ChatGPT Android 测试版(1.2025.070)上线:可设置为手机默认数字助理,替代谷歌 Gemini
3 月 17 日消息,根据外媒 9To5Google 上周的报道,ChatGPT 发布了最新 Android 测试版,可在设置中将 ChatGPT 设置为默认的数字助理。在设置后,长按 Home 按键、导航条或长按电源键都将默认启动 ChatGPT,可替代谷歌 Gemini。 ChatGPT 用户在将 Android 版 ChatGPT 更新到最新测试版(1.2025.070)后,在 Androi…- 1.8k
-
Gemini一键生成“电影”剧本,配合AI视频工具做影视短片教程
Gemini 2.0 大模型在沉寂一段时间之后,祭出新功能 Gemini 2.0 Flash Experimental,直接让多模态玩法又上了一个台阶。 文生图,图生图,连续生图,改图…等等,轻松拿下。 意味着,AI,现在可以一句话,一键直出图文绘本、故事动漫,甚至影视剧本了。 再配合 AI视频工具,做酷炫的影视短片,都不是事了。 闲话不多说,我们直奔主题。 如何使用呢? 直达链接:https:/…- 2.6k
-
谷歌 Gemini 2.0 Flash 模型拥有强大图片去水印功能,或触犯版权红线
3 月 17 日消息,近期,谷歌推出的 Gemini 2.0 Flash 模型在社交媒体上引发了争议。用户发现,该模型能够去除图片中的水印,包括来自盖蒂图片社(Getty Images)等知名图库的图片水印。 上周,谷歌扩大了对 Gemini 2.0 Flash 模型图像生成功能的访问权限。该功能允许模型原生生成和编辑图像内容,其能力十分强大。然而,该功能似乎缺乏必要的限制。Gemini 2.0 …- 682
-
Google Assistant 停用倒计时,谷歌 AI 助手开启迁移至 Gemini
谷歌公司昨日(3 月 14 日)发布公告,宣布退役经典版 Google Assistant,计划未来数月内逐步迁移用户至 Gemini,并计划 2025 年年底之前,在主流移动设备上停止经典版 Google Assistant 服务(旧设备仍可继续使用)。 注:Google Assistant 于 2016 年随初代 Pixel 手机推出,凭借自然语言处理和语音识别技术,用户可通过语音控制智能家居…- 1.3k
-
Gemini 2.0成P图神器,一句话就能实现一键P图
当梵高用颤抖的手涂抹星空时,不会预见未来的艺术家只需对AI说:"让柏树在量子漩涡中燃烧"。 谷歌研究院最新发布的Gemini 2.0多模态模型,正在重塑图像编辑的工作流,说说话就能一键P图! 此刻浅秋想说:这不就是当年自学Photoshop时想象人类能拥有的“超能力”嘛~没想到真有实现的这一天! 一、先来感受下效果 案例1:人像编辑 比如,我想让双眼闭着的模特睁开眼睛: 我想让…- 4.4k
-
谷歌 Gemini 向免费版用户开放“全局记忆”功能,可令 AI 回忆曾经所有对话
3 月 1 日消息,谷歌宣布旗下 Gemini AI 免费用户现也已支持“全局记忆”功能,也就是 AI 目前记得用户曾经与其进行过的所有对话,号称可以为用户提供更加私人化的回复,此前该功能仅向 Gemini Advanced 付费用户提供。 谷歌表示,免费用户目前不再需要通过“跳转到此前进行的对话历史记录”即可承接上一次对话,与 AI 交流,AI 将会记得用户与其进行的每一次对话。此外,用户还可以…- 2.6k
-
苹果被曝计划将谷歌 Gemini 与 Apple Intelligence 集成
据 9to5mac 网站报道,目前,苹果智能(Apple Intelligence)提供了将 Siri 请求导向 ChatGPT 的功能,能给出比 Siri 自身所能提供的更贴合上下文的回答。 在 2024 年苹果全球开发者大会(WWDC24)期间,苹果软件高管克雷格・费德里吉在一次采访中表示,他们希望能将苹果智能与其他人工智能模型集成,其中包括谷歌的 Gemini 模型。根据一项新的爆料,这种集…- 1.1k
-
谷歌憋大招:Gemini 将内嵌 AI视频生成,让人人都能是导演
2 月 19 日消息,科技媒体 Android Authority 昨日(2 月 18 日)发布博文,报道称谷歌旗下 AI 助手 Gemini 即将具备生成视频能力。该功能虽未正式上线,但种种迹象表明,谷歌正在积极为 Gemini 添加新功能,旨在打造更强大的 AI 工具。 该媒体拆解 v16.6.23 版 Google 应用 APK 文件,发现了生成视频相关代码描述。代码中多次出现“videog…- 1.9k
-
谷歌 Gemini AI 向免费版用户开放文件上传 / 分析功能
2 月 15 日消息,谷歌 Gemini AI 已开始向免费版用户开放文件上传和分析功能,此前该功能仅向 Gemini Advanced 付费用户提供。 目前,该功能已在 Gemini 安卓应用和网页版中上线,海外没有订阅 Gemini 的用户现在也可以直接从设备本地或 Google Drive 谷歌云盘中应用程序上传文件,之后即可询问有关该文档的见解。 当下尚不清楚该功能对免费版用户的具体限制。…- 1.7k
-
谷歌 Gemini 宣布上线“全局记忆”功能,订阅用户可令 AI 回忆曾经所有对话
2 月 14 日消息,谷歌宣布旗下 Gemini AI 上线“全局记忆”功能,也就是 AI 目前记得用户曾经与其进行过的所有对话,号称可以为用户提供更加私人化的回复。 目前,用户需要订阅 Gemini Advanced 服务才能在 Gemini App 和网页端体验相关功能,当下暂时仅支持英语,未来几周内将支持其他语言。 谷歌表示,用户目前不再需要通过“跳转到此前进行的对话历史记录”即可承接上一次…- 1.8k