# ASR_Theory **Repository Path**: oo/ASR_Theory ## Basic Information - **Project Name**: ASR_Theory - **Description**: No description available - **Primary Language**: Unknown - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-01-23 - **Last Updated**: 2026-03-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 后续该repo不再维护,请大家关注元语音网站与微信群(需要进群请再issue沟通),会有学者发对应的研究成果 # 元语音网站官方群:https://www.meta-speech.com # ASR_Theory 对于近研一期间所学进行总结,包括理论部分和实践部分,之间主要包括本人认为比较好的论文,以及也有自己的看法
[个人博客](https://blog.csdn.net/Xwei1226 "悬停显示") 包含自己近期的学习总结 ## PPT and Papers ppt主要包括本人研一期间使用kaldi语音识别工具构建`GMM-HMM`、`NN-HMM`语音识别声学模型
论文主要包括一些研一到到现在所看的论文,之后还会不定期更新论文,如果对理论比较感兴趣的同行可以持续关注
## INTERSPEECH Google'PPT 其中包含谷歌开源的18年INTERSPEECH的PPT,个人觉得写得非常棒,系统
## DL 总结 下面这幅图片是自己对于深度学习近期的网络进行总结,可以用本人在github开源仓库中的两个项目实现
[(1)ASR_Syllable](https://github.com/zw76859420/ASR_Syllable "悬停显示"):以音节为建模单元构建语音识别声学模型
[(2)ASR_WORD](https://github.com/zw76859420/ASR_WORD "悬停显示")以字为建模单元构建语音识别声学模型
[(3)ASR_Phone](https://github.com/zw76859420/ASR_Phone "悬停显示")以字为建模单元构建语音识别声学模型
![深度学习模型汇总](https://github.com/zw76859420/ASR_Theory/blob/master/nn.png)