复旦开源项目Hallo已适配ComfyUI插件

复旦开源的项目Hallo,一个根据音频和图片生成说话视频的项目,已经适配了ComfyUI插件。虽然安装过程中需要的依赖较多,门槛相对较高,但这一开源生态的出现,为后续的转绘和其他流程提供了更多的可能性和乐趣。

复旦开源项目Hallo已适配ComfyUI插件

Hallo项目通过输入音频,可以让面部照片开始说话,并且伴随着相应的表情,效果看起来非常自然。这个项目采用了端到端的扩散范式,引入了分层的音频驱动视觉合成模块,以提高音频输入与视觉输出之间的对齐精度,包括唇部、表情和姿势的运动。

这种分层音频驱动的视觉合成模块,提供了对表情和姿势多样性的自适应控制,更有效地实现了针对不同身份的个性化定制。这意味着,无论是谁的面部照片,都可以通过Hallo项目生成说话的视频,而且效果自然,仿佛真人在说话一般。

尽管Hallo项目的安装过程可能相对复杂,但它的出现无疑为开源生态带来了新的活力。随着技术的不断发展,我们可以期待未来会有更多这样的项目出现,为我们的生活带来更多的便利和乐趣。

插件地址:https://github.com/AIFSH/ComfyUI-Hallo

声明:内容均采集自公开的网站等各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

OpenAI 首席技术官:GPT-5 将在一年半后发布,部分领域智能达到“博士”级别

2024-6-22 9:31:49

资讯

​加拿大AI公司Waabi 获 2 亿美元资金,发展自动驾驶卡车

2024-6-22 9:37:09

搜索