代码拉取完成,页面将自动刷新
generate_scp_linux.py
是批量生成音频路径的脚本python generate_scp_linux.py
路径需要为音频所在路径wav/wav.scp
asr_timestamp_client.py
python asr_timestamp_client.py --host 172.29.52.197 --port 10095 --mode offline --audio_in wav/wav.scp --thread_num 1 --output_dir result/
result/result.txt
即ASR引擎返回的识别结果文件,用来进行对齐result/timestamp.json
即ASR引擎返回的识别结果含时间戳的Json文件label_alignment.py
python label_alignment.py --char=1 --v=1 label/test_long_text result/result.txt > result/alignment.txt
result/alignment.txt
即对齐的结果文件result/alignment.json
即对齐结果生成的Json文件generate_TextGrid.py
python generate_TextGrid.py
路径需修改为json所在路径TextGrid/
下的对应audio_name.TextGrid
timestamp.json
和alignment.json
提供python generate_TextGrid.py > timestamp_detail.txt
来获取TextGrid中每个字对应的时间戳。timestamp_detail.txt
中显示缺少的时间戳个数,如:SPKR00021.TextGrid已生成但缺少 1 个时间戳!此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。