网站推广的优势有哪些,免费建站网站 百度一下,做网站 业务流程图,静态网页制作本地部署 EmotiVoice易魔声 多音色提示控制TTS EmotiVoice易魔声 介绍ChatGLM3 Github 地址部署 EmotiVoice准备模型文件准备预训练模型推理 EmotiVoice易魔声 介绍
EmotiVoice是一个强大的开源TTS引擎#xff0c;支持中英文双语#xff0c;包含2000多种不同的音色#xff… 本地部署 EmotiVoice易魔声 多音色提示控制TTS EmotiVoice易魔声 介绍ChatGLM3 Github 地址部署 EmotiVoice准备模型文件准备预训练模型推理 EmotiVoice易魔声 介绍
EmotiVoice是一个强大的开源TTS引擎支持中英文双语包含2000多种不同的音色以及特色的情感合成功能支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
EmotiVoice提供一个易于使用的web界面还有用于批量生成结果的脚本接口。
ChatGLM3 Github 地址
https://github.com/netease-youdao/EmotiVoice
部署 EmotiVoice
克隆代码库
git clone https://github.com/netease-youdao/EmotiVoice
cd EmotiVoice创建虚拟环境
conda create -n EmotiVoice python3.10 -y
conda activate EmotiVoice使用 pip 安装 pytorch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# conda install -y -c nvidia/label/cuda-12.1.0 cuda-runtime验证 cuda 可用
python -c import torch;print(torch.cuda.is_available());使用 pip 安装依赖
pip install numpy numba scipy transformers4.26.1 soundfile yacs g2p_en jieba pypinyin准备模型文件
git lfs install
git clone https://huggingface.co/WangZeJun/simbert-base-chinese WangZeJun/simbert-base-chinese准备预训练模型
下载预训练模型, 然后运行:
mkdir -p outputs/style_encoder/ckpt
mkdir -p outputs/prompt_tts_open_source_joint/ckpt将 g_*, do_*文件放到outputs/prompt_tts_open_source_joint/ckpt将checkpoint_*放到outputs/style_encoder/ckpt中. 推理
推理输入文本格式是speaker|style_prompt/emotion_prompt/content|phoneme|content.
例如: 8051|非常开心|sos/eos uo3 sp1 l ai2 sp0 d ao4 sp1 b ei3 sp0 j ing1 sp3 q ing1 sp0 h ua2 sp0 d a4 sp0 x ve2 sos/eos|我来到北京清华大学.
其中的 speaker 说明可以参考这个页面。
其中的音素phonemes可以这样得到python frontend.py data/my_text.txt data/my_text_for_tts.txt.
然后运行
TEXTdata/inference/text
python inference_am_vocoder_joint.py \
--logdir prompt_tts_open_source_joint \
--config_folder config/joint \
--checkpoint g_00140000 \
--test_file $TEXT合成的语音结果在outputs/prompt_tts_open_source_joint/test_audio.
或者你可以直接使用交互的网页界面
pip install streamlit
streamlit run demo_page.py完结