谷歌发布文生视频模型Veo,可生成超60秒高清视频,附申请链接!

在 2024 年谷歌 I/O 开发者大会上,谷歌推出了 Veo,它是 OpenAI 的 Sora 的有力竞争对手。下面我们来详细了解一下这个产品。

Veo亮点

  • Veo 是谷歌 DeepMind 的文本视频生成模型,可以创建超过 60 秒的高质量 1080p 视频。
  • 它能够将文字和图片完美结合,生成符合两种输入要求的视频。
  • 它还支持使用文字描述进行视频编辑,包括对视频的特定区域的编辑。

关于谷歌Veo

Veo 是谷歌 DeepMind 开发的文本视频生成模型,Veo 能够生成超过60秒长,高质量 1080p 分辨率视频,覆盖多种电影和视觉风格。

在创建新视频的同时,它还能编辑已有的视频,将基于文字的说明融入其中,从而根据用户的需求进行视频修改。

Veo的强大之处在于它能够同时利用图像和文本提示来生成视频。用户可以输入文本提示和参考图像,Veo会将图像的视觉风格与文字提示的内容完美融合,制作出令人惊叹的视频作品。

谷歌发布文生视频模型Veo,可生成超60秒高清视频,附申请链接!

为了提高 Veo 对提示的理解和准确执行的能力,Google DeepMind 使用了更详细的视频字幕来丰富训练数据。

此外,该模型还使用了一种高质量的压缩视频表示方法(称为潜像),这将有助于提高效率。这些措施共同提高了整体视频质量,缩短了生成时间。

Veo 的多功能特性

Veo 利用先进的自然语言处理和视觉语义理解技术,能够准确地捕捉文本提示中的细节和色调,渲染出复杂场景中的复杂细节。

它提供了创意控制,可以理解各种电影效果的提示,比如时间倒叙、特写或者风景航拍。

Veo 的尖端技术不仅可以从零开始生成视频,还可以对现有的视频进行编辑,包括添加或修改场景中的特定元素。

此外,它还支持遮罩编辑,可以在视频的特定区域内进行有针对性的修改。下面的示例展示了如何根据需求编辑视频。

Veo 的先进的潜像扩散变压器解决了生成视频的视觉一致性和流动性问题,防止了帧间的人物、对象和风格的闪烁、跳跃或变形,从而提升了整体的观看体验。

它可以生成超过 60 秒的视频片段,既可以根据单个提示生成,也可以将一系列的提示拼接在一起,共同讲述一个故事。

Veo 的目标是实现视频制作的普及化,让经验丰富的电影制作者、内容创作者和教育工作者都能释放讲故事的潜能,并通过引人入胜的视觉效果分享知识。

如何使用 Veo?

谷歌 Veo 和 OpenAI 的 Sora 一样,现在还没有对公众开放。但是,Veo 已经在其新实验工具 VideoFX 中开放给部分创作者试用。

如果你对 Veo 感兴趣,可以申请加入等待名单,申请链接:https://deepmind.google/technologies/veo/。

当你点击注册按钮后,跳转到一个新的页面。点击 "使用 Google 登录 "后,系统会跳转到 Google Labs 登录页面。

然后,你就可以填写一个 Google 表格,申请加入等待名单,这样就有机会试用 VideoFX 的一些功能了。但是,Veo 目前只在少数几个GJ提供。

最后

在技术不断演进的今天,Veo和Sora的出现不仅代表着视频制作领域的创新,更意味着创作的普及化和平民化。

无论是专业的制作者还是普通的内容创作者,都可以通过这样的平台来展示自己的创意,传递自己的信息,分享自己的故事。

 

声明:内容均采集自公开的网站等各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
百科

GPT-4o官宣免费,GPT-4o都能做些什么?用AI赚钱的路子,AI都帮你想好了

2024-5-16 10:27:04

教程百科

AI生成职业照,用AI绘图5分钟做一个你自己的AI职业照

2024-5-17 13:13:41

搜索