虚拟主机怎么设计网站,网站后台 登录界面模板 远吗,资源下载类网站源码,网站首页打开速度简介
ChatTTS是专门为对话场景设计的文本转语音模型#xff0c;支持多人同时对话#xff0c;适用的场景非常丰富#xff0c;比如LLM助手对话任务#xff0c;视频配音、声音克隆等。同时支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练#xf…简介
ChatTTS是专门为对话场景设计的文本转语音模型支持多人同时对话适用的场景非常丰富比如LLM助手对话任务视频配音、声音克隆等。同时支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练功能非常的强大。 文本转语音TTS在生活中的应用非常的广泛比如有声小说、语音导航视频配音和智能家居控制等。 今天给大家推荐一个超强的TTS文本转语音应用适用于自然、对话式文本转语音特别适用于大型语言模型助手的对话任务以及诸如对话式音频和视频配音等并且可以免费使用。
教程
1. 下载项目源码
点击进入 chatTTS开源项目地址https://github.com/2noise/ChatTTS 解压zip文件安装python sdk python下载地址
2. 安装项目依赖
cmd控制面板 进入项目根目录创建python虚拟环境
执行命令创建一个名为.venv的虚拟环境
python -m venv .venv执行后会在项目根目录下生成一个.venv文件夹 执行安装项目依赖命令下载安装项目所需要的环境依赖
pip install --upgrade -r requirements.txt等待下载安装完成
快速启动 确保在执行以下命令时处于项目根目录下。 启动 WebUI 可视化界面执行以下命令
python examples/web/webui.py下次启动只用在项目根目录下执行这个命令即可首次启动会从 https://huggingface.co下载AI语音模型需要科学上网过程需要大约20分z左右。
使用教程
启动完成后会在浏览器里自动打开本地网址。 如果没有打开自己在浏览器输入栏输入网址 http://localhost:8080/
文生音频
在输入文本框内输入你要生成的语音的文字 选择你想要的音色 点击生成
会在输出音频框内显示生成的音频点击下载图标可以下载音频。 声音克隆
在采集音频这个上传一段你想要克隆的人物的声音视频不要出现其他人物的声音和其他杂音时长一分钟左右即可。
上传完在音频代码里面会有你克隆声音的向量代码复制粘贴 把复制的人物语音向量代码粘贴到说话人嵌入里面 然后和文生音频的步骤一样输入你要合成的文字点击生成按钮即可获得某个人得克隆音频。
相关文章推荐
《使用 Xinference 部署本地模型》 《Fastgpt接入Whisper本地模型实现语音输入》 《部署和接入使用重排模型bge-reranker》 《部署接入 M3E和chatglm2-m3e文本向量模型》 《Fastgpt 无法启动或启动后无法正常使用的讨论启动失败、用户未注册等问题这里》 《vllm推理服务兼容openai服务API》 《解决vllm推理框架内在开启多显卡时报错问题》