本地部署tts(本地部署大模型 配置需求)

在 Linux 上本地部署 ChatTTS 的步骤如下:

前提条件:需要有一张 4G 以上显存的 GPU 显卡。 具体步骤: 下载代码仓库。 安装依赖(注意有两个依赖未放在 requirements.txt 里)。 启动 webui 的 demo 程序,然后用浏览器登陆服务器的 ip:8080 就能试玩。 第一次启动后生成语音时,需要查看控制台输出,它会下载一些模型文件,因此比较慢,而且可能因网络问题有各种失败。但第一次加载成功后,后面就会顺利。 demo 提供的参数: –server_name:服务器的 IP 地址,默认 0.0.0.0。 –servic_port:即将开启的端口号。 –local_path:模型存储的本地路径。 webui 上可设置的参数: text:指需要转换成语音的文字内容。 Refine text:选择是否自动对输入的文本进行优化处理。 Audio Seed:语音种子,是一个数字参数,用于选择声音的类型,默认值为 2,是一个很知性的女孩子的声音。 Text Seed:文本种子,是一个正整数参数,用于 refine 文本的停顿。实测文本的停顿设置会影响音色、音调。

效果试用方面:

语音效果:接近真人语音语调,用的更接近日常普通人的音色。 运算速度:基于 L4 GPU 本地部署,22s 的音频需要 12s 的推理时间。若用 4090,速度约为 L4 的 2 倍,即 6s 左右。模型未做优化,优化后有望在 4090 上只用 2 – 3s 推理时间。 功能试玩:提供的功能简单。 音色更换:可通过调整 Audio seed 和 Text seed 等参数实现。

0
分享到:
没有账号? 忘记密码?