兴趣屋

标题: AI音频克隆TTS v2.0 3秒语音即可快速克隆音色 [打印本页]

作者: admin 时间: 2024-12-29 19:25
标题: AI音频克隆TTS v2.0 3秒语音即可快速克隆音色
AI音频克隆TTS 是一款基于阿里开源的CosyVoice 打包制作的语音克隆软件。你无需复杂的操作，也不需要联网，仅需下载后，解压运行启动程序即可使用。该软件完全免费，你仅需提供要克隆的最短3秒语音，就可以进行克隆，支持跨语种识别克隆和生成，并且支持方言，十分强大！
()

相关软件推荐：
1. AI人脸替换软件（ >>>点击直达）
2. AI让图片中人说话软件（ >>>点击直达）

AI音频克隆TTS 功能介绍：
1. 支持语言：中文、英文、日文、韩文、中国本地方言（包括：粤语、四川话、天津话、上海话、武汉话等）
2. 三种语音克隆模式：
（1）3s音频克隆：输入文字，导入3s以上的wav参考音频，输入参考音频prompt文本，点击生成即可；
（2）跨语种克隆：输入其他语种文字，导入3s以上的wav参考音频，输入参考音频prompt文本，点击生成即可；
（3）自然语言控制：输入自然语言控制文本，比如用四川话说这句话，自然语言控制模式下，点击生成即可；
3. 文本添加：可以通过复制粘贴或者直接导入文本添加，支持txt文本或者srt字幕；

AI音频克隆TTS 特点：
1. 超低延迟。
双向流媒体支持：CosyVoice2.0集成了离线和流媒体建模技术。
快速首包合成：在保持高质量音频输出的同时，实现低至150ms的延退
2. 高精度
改进的发音：与CosyVoice30相比，将发音错误减少50%到1.0%。
基准测试成就：在Seed-TTS评估集的硬测试集中获得最低的字符错误率
3. 稳定性强
音色一致性：确保零镜头和跨语言语音合成的可靠语音一致性。
跨语言合成：与1.0版本相比有显著改进

AI音频克隆TTS 使用方法：
1. 下载AI音频克隆TTS程序包，解压缩到任意目录文件夹中；（文件夹路径不能有中文）
2. 双击 AI音频克隆启动程序，打开即可免费使用；
()
3. 推理模式按需选择即可，如果是中文普通话，直接使用3s音频克隆模式即可；
4. 选择参考音频：导入要克隆的wav格式音频，注意采样率不低于16khz，这种参考视频仅在3s音频克隆和跨语种克隆模式可用；
5. 参考音频文本：将你的参考音频语音文字化，将文字输入到此输入框中；
6. 点击开始生成，等待完成即可。
()

AI音频克隆TTS 下载地址：

隐藏内容，登录后可见

>>>立即登录（注册说明）

注：本站文件解压密码统一为：www.xqu5.com

欢迎光临兴趣屋 (https://www.xqu5.com/)