代码拉取完成,页面将自动刷新
import os
import re
# 设置音频文件所在目录
audio_dir = '/home00/dwenxu/asr_timestamp_insert_text_grid/asr/wer0-50andtext10-15-wav'
# 设置输出文件名
output_file = '/home00/dwenxu/asr_timestamp_insert_text_grid/asr/wav/wav.scp'
def natural_sort_key(s):
return [
int(text) if text.isdigit() else text.lower()
for text in re.split(r'(\d+)', s)
]
def generate_scp(audio_dir, audio_files):
# 获取音频文件列表,并排序
audio_files = sorted(os.listdir(audio_dir), key=natural_sort_key)
# 生成scp文件内容
with open(output_file, 'w', encoding='utf-8') as f:
for audio_file in audio_files:
if audio_file.endswith('.wav'):
# 获取不含文件格式的音频文件名
file_name = os.path.splitext(audio_file)[0]
# 拼接绝对路径
absolute_path = os.path.join(audio_dir, audio_file).replace('\\', '/')
# 将路径写入到scp文件中
f.write(f'{file_name} {absolute_path}\n')
print("SCP 文件已生成.")
if __name__ == "__main__":
generate_scp(audio_dir, output_file)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。