# BXC_AudioNet **Repository Path**: heliang230/BXC_AudioNet ## Basic Information - **Project Name**: BXC_AudioNet - **Description**: 适用于音频片段分类的算法训练框架 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-11-27 - **Last Updated**: 2025-11-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### BXC_AudioNet * 作者:北小菜 * 官网:http://www.beixiaocai.com * 邮箱:bilibili_bxc@126.com * QQ:1402990689 * 微信:bilibili_bxc * 哔哩哔哩主页:https://space.bilibili.com/487906612 * gitee开源地址:https://gitee.com/Vanishi/BXC_AudioNet * github开源地址:https://github.com/beixiaocai/BXC_AudioNet ### 项目介绍 * 适用于音频片段分类的算法训练框架 ### 安装环境请注意 * 在使用python开发项目时,推荐使用python的虚拟环境。因为同一台电脑上很可能会安装多个python项目,而不同的python项目可能会使用不同的依赖库,为了避免依赖库不同而导致的冲突,可以使用python虚拟环境 * 关于如何使用python虚拟环境,其实非常简单,文档最下面提供Windows系统和Linux系统创建和使用虚拟环境的方法 * Windows建议使用Python3.10,Linux建议使用Python3.8 * [python官网下载地址](https://www.python.org/getit/) * [python网盘下载地址](https://pan.quark.cn/s/72df133d1343) #### Windows系统安装Python虚拟环境 ~~~ //创建虚拟环境 python -m venv venv //切换到虚拟环境 venv\Scripts\activate //更新虚拟环境的pip版本 python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple //在虚拟环境中安装依赖库 python -m pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple ~~~ #### Linux系统安装Python虚拟环境 ~~~ //创建虚拟环境 python -m venv venv //激活虚拟环境 source venv/bin/activate //更新虚拟环境的pip版本 python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple //在虚拟环境中安装依赖库 python -m pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple ~~~ ### 安装pytorch-cpu依赖库 * pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple ### 安装pytorch-gpu依赖库 * pip install -r requirements-gpu.txt -i https://pypi.tuna.tsinghua.edu.cn/simple * pip install torch==2.1.0 torchaudio==2.1.0 torchvision==0.16.0 --index-url https://download.pytorch.org/whl/cu121 * 注意:安装pytorch-gpu训练环境,请根据自己的电脑硬件选择cuda版本,比如我上面选择的https://download.pytorch.org/whl/cu121,并非适用所有电脑设备,请根据自己的设备选择 ### 如何使用 ~~~ //训练模型 python train.py --data_dir data --save_dir checkpoints --batch_size 32 --epochs 30 --lr 0.001 //测试模型(方式1) python test.py --model_path checkpoints/best_model.pt --audio_path data/val/non_snore/0_400.wav //测试模型(方式2) python test_ov_by_torchaudio.py --model_path checkpoints/best_model_openvino_model/best_model.xml --audio_path data/val/non_snore/0_400.wav //测试模型(方式3) python test_ov_by_rosa.py --model_path checkpoints/best_model_openvino_model/best_model.xml --audio_path data/val/non_snore/0_400.wav //将pt模型转换为onnx格式的模型 //依赖库:pip install onnxruntime==1.19.0 onnx==1.16.1 -i https://pypi.tuna.tsinghua.edu.cn/simple python export2onnx.py --pt checkpoints/best_model.pt --onnx checkpoints/best_model.onnx //将onnx模型转换为openvino格式的模型 //依赖库:pip install openvino==2024.3.0 openvino-dev==2024.3.0 onnxruntime==1.19.0 onnx==1.16.1 -i https://pypi.tuna.tsinghua.edu.cn/simple mo --input_model checkpoints/best_model.onnx --output_dir checkpoints/best_model_openvino_model ~~~ ### 训练数据集(免费下载) * 打鼾+不打鼾语音识别2分类数据集-夸克网盘下载地址:https://pan.quark.cn/s/4d83dabff0a6