# VOICE **Repository Path**: wind_juvenile/VOICE ## Basic Information - **Project Name**: VOICE - **Description**: 这是一个声音识别系统,根据不同人的声音识别出来进行展示入库 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-04-12 - **Last Updated**: 2024-04-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 这是一个声音识别系统文件 ### 主要功能如下 ``` 1、收集一定规模的音频数据集,包含多种类型和来源的音频样本。 2、使用合适的频谱分析方法,例如短时傅里叶变换(Short-Time Fourier Transform,STFT)或梅尔频谱分析(MelSpectrogram),将音频信号转换为频谱表示。 3、设计一种有效的音频指纹提取算法,将频谱表示转换为紧凑且具有唯一性的音频指纹特征。 4、选择合适的匹配算法,例如哈希函数或相似度计算方法,用于在数据库中快速匹配和识别音频指纹。 5进行实验评估,测试系统在不同噪声和变形条件下的识别性能,并进行性能优化。 ``` ### 项目安装软件 - 安装python3.11.4 - 执行pip install requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple - mac、ubuntu 安装ffmpeng ``` brew install ffmpeg # MacOS sudo apt-get install ffmpeg # Ubuntu ``` - win 安装ffmpeng ``` 1.打开FFmpeg官方下载页面:https://www.ffmpeg.org/download.html。在"Windows builds"栏目下,点击"get packages link",在这里我选择的是gpgkey的站点。 2.选择合适你的Windows系统(32-bit或64-bit, 大部分现在是64-bit)的"Static"版本下载。下载文件是一个.zip压缩包。 3.下载完成后,解压这个.zip文件。建议将解压后的文件夹放置在一个不会轻易删除和移动的位置,比如C:\目录下。 4.然后进行环境变量设置。右键点击电脑-->属性-->高级系统设置-->环境变量。在系统变量中找到"Path",点击编辑,将解压的文件夹中bin目录的地址添加进去。 例如,如果你将文件解压在了C:\目录下,文件夹名为ffmpeg,那么你应该添加的地址就是C:\ffmpeg\bin 5.最后,验证是否安装成功,在"开始" --> "运行" 中输入"cmd" 打开命令行,输入ffmpeg,如果出现ffmpeg的相关信息,则说明安装成功。 ``` ## 目录说明 -- 参考 参考资料 --source 资源文件 --.gitignore 忽略文件 --autio_fingerprints.db 音频数据库会自动创建 --get_voice_figer.py 获取音频数据,并根据算法存储到数据库中 --requirement.py 安装需要的文件 --voice_to_picture.py 将音频转成图片 ├── audio_fingerprints.db 匹配数据库 ├── get_voice_figer.py 将声音指纹转成指纹并存储到数据库,并拿起它声音进行匹配 ├── get_voice_figer_detail.py 将声音指纹转成指纹并存储到数据库,并拿起它声音进行匹配,涉及到峰值列表算法,不是很完善,存储数据库时间过长 ├── voice_to_picture.py 将声音转成图片 ├── requirement.txt 安装依赖 ├── source │ ├── wav │ │ ├── 王菲.wav │ │ ├── 林俊杰.wav │ │ ├── 薛之谦.wav │ │ └── 薛凯琪.wav │ ├── 王菲.mp3 │ ├── 方大同.mp3 │ ├── 林俊杰.mp3 │ ├── 薛之谦.mp3 │ ├── 薛凯琪.mp3 │ └── 邓紫棋.mp3 └── 参考 ├── 基于功率谱特征的音频指纹实现_鲁明明.pdf ├── 基于音频指纹的压缩域音频识别方法研究_明建成.pdf └── 音频指纹提取方法在多媒体信息识别中的应用研究_宋文喆.pdf