一张照片创造 1 分钟人物视频，商汤发布首个“可控”人物视频生成大模型 Vimi

商汤科技在世界人工智能大会（WAIC）上发布了首个“可控”人物视频生成大模型 Vimi，通过一张任意风格的照片就能生成和目标动作一致的人物类视频，并支持多种驱动方式，可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

与图片表情控制类技术只能控制头部表情动作不同，商汤称 Vimi 不但可以实现精准的人物表情控制，还可实现在半身区域内控制照片中人物的自然肢体变化，并自动生成与人物相符的头发、服饰及背景变化。

同时 Vimi 可稳定生成 1 分钟的单镜头人物类视频，画面效果不会随着时间的变化而劣化或失真，满足娱乐互动等需要长时间稳定视频生成需求。

Vimi 将完全面向 C 端用户开放使用，用户只需上传不同角度的高清人物图片，即可自动生成数字分身和不同风格的写真视频。

由 Vimi 生成的视频人物不再只是呆板的五官运动，而是搭配手势、肢体、头发等，形成更完整、统一的人物动作，让创作者可基于生成的视频素材进行剪辑和再创作。

商汤表示将在明日公布 Vimi 的更多细节，IT之家也会持续关注并带来跟进报道。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

一张照片创造 1 分钟人物视频，商汤发布首个“可控”人物视频生成大模型 Vimi

售价预计 2 万美元，特斯拉二代人形机器人 Optimus 亮相世界人工智能大会

比尔盖茨谈当前 AI 市场：准入门槛低吸引海量资本涌入，狂热程度远超互联网泡沫

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

售价预计 2 万美元，特斯拉二代人形机器人 Optimus 亮相世界人工智能大会

比尔盖茨谈当前 AI 市场：准入门槛低吸引海量资本涌入，狂热程度远超互联网泡沫

商汤科技推出Vimi视频生成大模型 C端应用Vimi相机开放内测

商汤如影AI视频生成平台推出央视记者王冰冰AI数字人“AI冰冰”

售价预计 2 万美元，特斯拉二代人形机器人 Optimus 亮相世界人工智能大会

商汤绝影行业首发原生多模态大模型车端部署：80 亿参数、每秒 40 Tokens

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注