兴趣屋
标题:
AI音频克隆TTS v2.0 3秒语音即可快速克隆音色
[打印本页]
作者:
admin
时间:
2024-12-29 19:25
标题:
AI音频克隆TTS v2.0 3秒语音即可快速克隆音色
AI音频克隆TTS 是一款基于 阿里开源的CosyVoice 打包制作的语音克隆软件。你无需复杂的操作,也不需要联网,仅需下载后,解压运行启动程序即可使用。该软件完全免费,你仅需提供要克隆的最短3秒语音,就可以进行克隆,支持跨语种识别克隆和生成,并且支持方言,十分强大!
()
上传
点击文件名下载附件
相关软件推荐:
1. AI人脸替换软件 (
>>>点击直达
)
2. AI让图片中人说话软件(
>>>点击直达
)
AI音频克隆TTS 功能介绍:
1. 支持语言:中文、英文、日文、韩文、中国本地方言(包括:粤语、四川话、天津话、上海话、武汉话等)
2. 三种语音克隆模式:
(1)3s音频克隆:输入文字,导入3s以上的wav参考音频,输入参考音频prompt文本,点击生成即可;
(2)跨语种克隆:输入其他语种文字,导入3s以上的wav参考音频,输入参考音频prompt文本,点击生成即可;
(3)自然语言控制:输入自然语言控制文本,比如用四川话说这句话,自然语言控制模式下,点击生成即可;
3. 文本添加:可以通过复制粘贴或者直接导入文本添加,支持txt文本或者srt字幕;
AI音频克隆TTS 特点:
1. 超低延迟。
双向流媒体支持:CosyVoice2.0集成了离线和流媒体建模技术。
快速首包合成:在保持高质量音频输出的同时,实现低至150ms的延退
2. 高精度
改进的发音:与CosyVoice30相比,将发音错误减少50%到1.0%。
基准测试成就:在Seed-TTS评估集的硬测试集中获得最低的字符错误率
3. 稳定性强
音色一致性:确保零镜头和跨语言语音合成的可靠语音一致性。
跨语言合成:与1.0版本相比有显著改进
AI音频克隆TTS 使用方法:
1. 下载AI音频克隆TTS程序包,解压缩到任意目录文件夹中;(文件夹路径不能有中文)
2. 双击 AI音频克隆 启动程序,打开即可免费使用;
()
上传
点击文件名下载附件
3. 推理模式按需选择即可,如果是中文普通话,直接使用3s音频克隆模式即可;
4. 选择参考音频:导入要克隆的wav格式音频,注意采样率不低于16khz,这种参考视频仅在3s音频克隆和跨语种克隆模式可用;
5. 参考音频文本:将你的参考音频语音文字化,将文字输入到此输入框中;
6. 点击开始生成,等待完成即可。
()
上传
点击文件名下载附件
AI音频克隆TTS 下载地址:
隐藏内容,登录后可见
>>>立即登录
(注册说明)
注:本站文件解压密码统一为:
www.xqu5.com
欢迎光临 兴趣屋 (https://www.xqu5.com/)
Powered by Discuz! X3.5