阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。
如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。
通义APP首批上线了多达80个EMO模板,涵盖了热门歌曲、网络热梗等多种内容。用户可以选择预置的音频来生成视频,但目前暂不支持用户自定义音频。
EMO模型是通义实验室精心研发的AI模型,其背后的肖像说话技术正是当前AIGC领域的热门话题。与传统的Talking Head技术相比,EMO模型采用了创新的弱控制设计,无需对人脸、人头或身体部分进行繁琐的3D建模,即可轻松驱动肖像开口说话。这不仅大大降低了视频生成的成本,还显著提升了视频的质量。
EMO模型具备强大的学习能力,能够编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型精准匹配,甚至能将音频的语气特征和情绪色彩细腻地反映到人物的微表情上,使得生成的视频更加生动逼真。
自2月底通义实验室公布相关论文以来,EMO模型便受到了广泛关注,成为继Sora之后最受瞩目的AI模型之一。未来,EMO技术有望在数字人、数字教育、影视制作、虚拟陪伴、电商直播等众多领域发挥巨大潜力。
通义APP一直致力于为用户提供前沿模型的免费体验。除了EMO模型外,通义APP还推出了众多现象级应用,如“全民舞王”、“兵马俑跳科目三”、“金毛跳舞”等,这些应用背后的模型也均出自通义实验室。此外,通义APP还不断推出实用功能,如超长文档解析、AI编码助手、AI会议助手等,为用户提供全方位的超级AI助手服务。