本地部署tts（本地部署大模型配置需求）

在 Linux 上本地部署 ChatTTS 的步骤如下：

前提条件：需要有一张 4G 以上显存的 GPU 显卡。具体步骤：下载代码仓库。安装依赖（注意有两个依赖未放在 requirements.txt 里）。启动 webui 的 demo 程序，然后用浏览器登陆服务器的 ip:8080 就能试玩。第一次启动后生成语音时，需要查看控制台输出，它会下载一些模型文件，因此比较慢，而且可能因网络问题有各种失败。但第一次加载成功后，后面就会顺利。 demo 提供的参数： –server_name：服务器的 IP 地址，默认 0.0.0.0。 –servic_port：即将开启的端口号。 –local_path：模型存储的本地路径。 webui 上可设置的参数： text：指需要转换成语音的文字内容。 Refine text：选择是否自动对输入的文本进行优化处理。 Audio Seed：语音种子，是一个数字参数，用于选择声音的类型，默认值为 2，是一个很知性的女孩子的声音。 Text Seed：文本种子，是一个正整数参数，用于 refine 文本的停顿。实测文本的停顿设置会影响音色、音调。

效果试用方面：

语音效果：接近真人语音语调，用的更接近日常普通人的音色。运算速度：基于 L4 GPU 本地部署，22s 的音频需要 12s 的推理时间。若用 4090，速度约为 L4 的 2 倍，即 6s 左右。模型未做优化，优化后有望在 4090 上只用 2 – 3s 推理时间。功能试玩：提供的功能简单。音色更换：可通过调整 Audio seed 和 Text seed 等参数实现。

猜你喜欢