Vidu, a large model of domestic Vincennes video, releases version 1.5 update: Ensures consistency across multiple viewpoints

国产文生视频大模型厂商 Vidu 昨日宣布,Vidu 1.5 新版本正式上线,其实现了“世界领先水平”的突破 —— 能够理解多样化的输入,突破“一致性”的难题。

Vidu, a large model of domestic Vincennes video, releases version 1.5 update: Ensures consistency across multiple viewpoints

Vidu 方面称,其在上线之初就已具备角色一致性生成能力,通过锁定人物面部特征可解决视频生成的关键痛点,确保了人物面部特征的一致性。此次发布的更新中,Vidu 则首次展现了上下文学习的能力,提升了整体视频模型的可控性,通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。

获悉,其在三个方面直观呈现了“技术突破”:

  • 复杂主体的精准控制:无论是细节丰富的角色,还是复杂的物体,Vidu 都能保证其在多个不同视角下的一致性。如造型复杂的 3D 动画风格角色,无论视角如何变化,其能够始终确保头型、服饰的全角度细节一致,避免了传统视频模型在复杂视角切换时产生的瑕疵。
  • 人物面部特征和动态表情的自然一致:在人物特写镜头中,其能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象.
  • 多主体一致性:用户可上传多个主题图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。例如,用户可以上传主体、客体和环境的图片,创建定制角色身穿特定服装、在定制空间内自由动作的场景。
statement:The content is collected from various media platforms such as public websites. If the included content infringes on your rights, please contact us by email and we will deal with it as soon as possible.
Information

Tencent's Big Model App Yuan Yuan Released Version 2.0: Based on New Generation Big Model Hybrid Turbo, Built-in AI Searching

2024-11-14 21:14:27

Information

讯飞星火多模态交互大模型上线,数字人、语音、视觉支持一键调用

2024-11-15 0:16:23

Search