1 Star 1 Fork 0

canLan / MockingBird

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
MIT

实时语音克隆 - 中文/普通话(简化板)

English | 中文

特性

1. 安装要求

按照原始存储库测试您是否已准备好所有环境。 Python 3.7 或更高版本 需要运行工具箱。

如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 这个错误可能是 python 版本过低,3.9 可以安装成功

  • 安装 ffmpeg
  • 运行pip install -r requirements.txt 来安装剩余的必要包。
  • 安装 webrtcvad pip install webrtcvad-wheels

2.使用社区预先训练好的合成器(与2.1二选一)

作者 下载链接 效果预览 信息
作者 https://pan.baidu.com/s/1VHSKIbxXQejtxi2at9IrpA 百度盘链接 提取码:i183 200k steps 只用aidatatang_200zh
@FawenYo https://drive.google.com/file/d/1H-YGOUHpmqKxJ9FRc6vAjPuqQki24UbC/view?usp=sharing 百度盘链接 提取码:1024 input output 200k steps 台湾口音
@miven https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021 https://www.bilibili.com/video/BV1uh411B7AD/ 150k steps 旧版需根据issue修复

3 启动Web程序:

python web.py 运行成功后在浏览器打开地址, 默认为 http://localhost:8080

注:目前界面比较buggy,

  • 第一次点击录制要等待几秒浏览器正常启动录音,否则会有重音
  • 录制结束不要再点录制而是停止
  • 仅支持手动新录音(16khz), 不支持超过4MB的录音,最佳长度在5~15秒
  • 默认使用第一个找到的模型,有动手能力的可以看代码修改 web\__init__.py

文件结构(目标读者:开发者)

├─archived_untest_files 废弃文件
├─encoder encoder模型
│  ├─data_objects
│  └─saved_models 预训练好的模型
├─samples 样例语音
├─synthesizer  synthesizer模型
│  ├─models
│  ├─saved_models 预训练好的模型
│  └─utils 工具类库
├─toolbox 图形化工具箱
├─utils 工具类库
├─vocoder  vocoder模型(目前包含hifi-gan、wavrnn)
│  ├─hifigan
│  ├─saved_models 预训练好的模型
│  └─wavernn
└─web
    ├─api
    │  └─Web端接口
    ├─config
    │  └─ Web端配置文件
    ├─static 前端静态脚本
    │  └─js 
    ├─templates 前端模板
    └─__init__.py Web端入口文件
MIT License Modified & original work Copyright (c) 2019 Corentin Jemine (https://github.com/CorentinJ) Original work Copyright (c) 2018 Rayhane Mama (https://github.com/Rayhane-mamah) Original work Copyright (c) 2019 fatchord (https://github.com/fatchord) Original work Copyright (c) 2015 braindead (https://github.com/braindead) Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software. THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.

简介

实时语音克隆 - 中文/普通话 展开 收起
Python 等 3 种语言
MIT
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Python
1
https://gitee.com/hfsc/MockingBird.git
git@gitee.com:hfsc/MockingBird.git
hfsc
MockingBird
MockingBird
Add-GST

搜索帮助