1 Star 0 Fork 0

嗜雪的蚂蚁/asr_timestamp_insert_text_grid

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

将ASR引擎的时间戳进行对齐并生成TextGrid

generate_scp_linux.py 是批量生成音频路径的脚本

执行的命令为:python generate_scp_linux.py路径需要为音频所在路径

生成的文件路径为:wav/wav.scp


ASR时间戳模型的客户端为: asr_timestamp_client.py

执行的命令为:

python asr_timestamp_client.py --host 172.29.52.197 --port 10095 --mode offline --audio_in wav/wav.scp --thread_num 1 --output_dir result/

生成两个文件:

result/result.txt 即ASR引擎返回的识别结果文件,用来进行对齐

result/timestamp.json 即ASR引擎返回的识别结果含时间戳的Json文件


与真值进行对齐的脚本:label_alignment.py

执行的命令为:

python label_alignment.py --char=1 --v=1 label/test_long_text result/result.txt > result/alignment.txt

生成两个文件:

result/alignment.txt 即对齐的结果文件

result/alignment.json 即对齐结果生成的Json文件


生成TextGrid的脚本:generate_TextGrid.py

执行的命令为:python generate_TextGrid.py 路径需修改为json所在路径

生成的文件为:

TextGrid/下的对应audio_name.TextGrid

TextGrid文件的时间戳和音频持续时间以及识别结果及其拼音

timestamp.json alignment.json 提供

可执行:python generate_TextGrid.py > timestamp_detail.txt 来获取TextGrid中每个字对应的时间戳。

注: 模型在一些情况下生成的时间戳个数低于识别到的字符个数

这时候会在生成的TextGrid文件前加“#”区分,如#SPKR00021.TextGrid

也会在timestamp_detail.txt中显示缺少的时间戳个数,如:SPKR00021.TextGrid已生成但缺少 1 个时间戳!

空文件

简介

语音识别以及时间戳和textgrid文件处理相关 展开 收起
取消

发行版

暂无发行版

贡献者

全部

语言

近期动态

不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/mayi123/asr_timestamp_insert_text_grid.git
git@gitee.com:mayi123/asr_timestamp_insert_text_grid.git
mayi123
asr_timestamp_insert_text_grid
asr_timestamp_insert_text_grid
master

搜索帮助