腾讯混元大模型上线并开源文生视频能力:支持中英文双语输入,参数量 130 亿

腾讯 12 月 3 日宣布,混元大模型上线并开源文生视频能力,参数量 130 亿,支持中英文双语输入。

腾讯混元大模型上线并开源文生视频能力:支持中英文双语输入,参数量 130 亿

官方宣称,腾讯混元视频生成大模型可以生成“超写实的”高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律

据介绍,腾讯混元视频生成大模型采用 DiT 架构适配了新一代文本编码器提升语义遵循,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。

在“腾讯元宝 App”,进入“AI 应用”,选择“AI 视频”,可申请试用。

腾讯表示,本次开源包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件

声明:内容均采集自公开的网站等各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

三星在韩国推出 AI 订阅俱乐部服务,用户可租赁智能家电

2024-12-4 1:52:39

资讯

中国电信“天翼”AI 手机发布:联合高通、中兴研发,端侧 3B 模型

2024-12-4 6:55:14

搜索