快速而简单的端到端全长歌曲生成.
[2025-03-21]⚒️: 代码重构, 超快生成速度, 4分45秒音乐, 20秒不到生成, 1分35秒音乐, 7秒不到生成. 增加更多可调参数, 畅玩更自由. 可选是否卸载模型.
[2025-03-16]⚒️: 发布版本 v2.0.0. 支持全长音乐生成, 4 分钟仅需 62 秒.
下载模型放到 ComfyUI\models\TTS\DiffRhythm
文件夹下:
cfm_full_model.pt
, 同时下载 comfig.json 放到一起.[2025-03-13]⚒️: 发布版本 v1.0.0.
cd ComfyUI/custom_nodes
git clone https://github.com/billwuhao/ComfyUI_DiffRhythm.git
cd ComfyUI_DiffRhythm
pip install -r requirements.txt
# python_embeded
./python_embeded/python.exe -m pip install -r requirements.txt
模型会自动下载到 ComfyUI\models\TTS\DiffRhythm
文件夹下.
结构如下:
手动下载地址:
https://huggingface.co/ASLP-lab/DiffRhythm-base/blob/main/cfm_model.pt
https://huggingface.co/ASLP-lab/DiffRhythm-vae/blob/main/vae_model.pt
https://huggingface.co/OpenMuQ/MuQ-MuLan-large/tree/main
https://huggingface.co/OpenMuQ/MuQ-large-msd-iter/tree/main
https://huggingface.co/FacebookAI/xlm-roberta-base/tree/main
Windows 系统做如下配置.
下载安装最新版 espeak-ng
添加环境变量 PHONEMIZER_ESPEAK_LIBRARY
到系统中, 值是你安装的 espeak-ng 软件中 libespeak-ng.dll
文件的路径, 例如: C:\Program Files\eSpeak NG\libespeak-ng.dll
.
Linux 系统下, 需要安装 espeak-ng
软件包. 执行如下命令安装:
apt-get -qq -y install espeak-ng
应该支持 Mac, 但尚未测试.
享受音乐吧🎶
感谢 DiffRhythm 团队的卓越的工作, 目前最强开源 音乐/歌曲 生成模型👍.
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。