# asr **Repository Path**: snowjake/asr ## Basic Information - **Project Name**: asr - **Description**: asr - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-10-09 - **Last Updated**: 2021-10-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 本项目开始训练请执行: ```shell $ python3 train_mspeech.py ``` 本项目开始测试请执行: ```shell $ python3 test_mspeech.py ``` 测试之前,请确保代码中填写的模型文件路径存在。 ASRT API服务器启动请执行: ```shell $ python3 asrserver.py ``` ## Model 模型 ### Speech Model 语音模型 CNN + LSTM/GRU + CTC 其中,输入的音频的最大时间长度为16秒,输出为对应的汉语拼音序列 ## Python Import Python的依赖库 * python_speech_features * TensorFlow * Keras * Numpy * wave * matplotlib * math * Scipy * h5py * http * urllib ## Data Sets 数据集 * **清华大学THCHS30中文语音数据集** data_thchs30.tgz [OpenSLR国内镜像]() [OpenSLR国外镜像]() test-noise.tgz [OpenSLR国内镜像]() [OpenSLR国外镜像]() resource.tgz [OpenSLR国内镜像]() [OpenSLR国外镜像]() * **Free ST Chinese Mandarin Corpus** ST-CMDS-20170001_1-OS.tar.gz [OpenSLR国内镜像]() [OpenSLR国外镜像]() * **AIShell-1 开源版数据集** data_aishell.tgz [OpenSLR国内镜像]() [OpenSLR国外镜像]() 注:数据集解压方法 ``` $ tar xzf data_aishell.tgz $ cd data_aishell/wav $ for tar in *.tar.gz; do tar xvf $tar; done ``` * **Primewords Chinese Corpus Set 1** primewords_md_2018_set1.tar.gz [OpenSLR国内镜像]() [OpenSLR国外镜像]() * **aidatatang_200zh** aidatatang_200zh.tgz [OpenSLR国内镜像]() [OpenSLR国外镜像]()