微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频

微软 Azure AI 语音服务允许开发者构建多语言生成式 AI语音应用,Azure AI 语音服务最新推出了文本到语音虚拟人功能,可以将简单的文本转换为人类自然说话视频

今天,微软宣布全面推出 Text to Speech Avatar 功能。这项新功能使开发者能够为其用户创建个性化虚拟人。该服务的输出视频分辨率为 1920 x 1080,每秒 25 帧。IT之家附示例如下:

微软 Azure AI 语音服务推出虚拟人形象,支持文本转视频

Text to Speech Avatar 具有以下功能:

  • 将文本转换为由 Azure AI 文本转语音提供支持的人类说话视频,该视频具有自然的声音。
  • 提供不同的人物预设形象。
  • 形象的声音由 Azure AI 文本转语音生成。
  • 使用批量合成 API 异步或实时合成文本到语音人像视频。
  • 在 Speech Studio 中提供内容创建工具,无需编码即可创建视频内容。
  • 通过 Speech Studio 中的实时聊天头像工具启用实时人像对话。

定价方面,文本转视频服务的收费将根据视频输出的长度计算并按秒收费。该服务现已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部地区推出。

声明:内容均采集自公开的网站等各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

McAfee 携手联想推出“全球首款自动 Deepfake 检测器”,遏制 AI诈骗

2024-8-23 9:44:08

资讯

原 Character.AI CEO 诺姆・沙泽尔“回家”后履新,消息称将任谷歌 Gemini 联合技术负责人

2024-8-23 9:51:35

搜索