FunClip是由阿里达摩院开源的AI自动视频剪辑工具。模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。这意味着,大量繁琐的工作可以通过AI来实现。
FunClip功能
自动化语音识别:集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,Modelscope下载量1300w+次,并且能够一体化的准确预测时间戳。
热词定制化:通过集成的SeACo-Paraformer模型,用户可以指定一些实体词、人名等作为热词,以提升特定词汇的识别准确率。
说话人识别:集成CAM++说话人识别模型,允许用户根据自动识别的说话人ID裁剪出特定说话人的视频段落。
视频裁剪:用户可以选择识别结果中的文本片段或指定说话人,通过点击裁剪按钮获取对应视频片段。
多段剪辑支持:FunClip支持用户对视频进行多段剪辑,提供了灵活的编辑能力。
官网地址:https://github.com/alibaba-damo-academy/FunClip