# VOICE

**Repository Path**: wind_juvenile/VOICE

## Basic Information

- **Project Name**: VOICE
- **Description**: 这是一个声音识别系统，根据不同人的声音识别出来进行展示入库
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2024-04-12
- **Last Updated**: 2024-04-17

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

## 这是一个声音识别系统文件

### 主要功能如下
```
1、收集一定规模的音频数据集，包含多种类型和来源的音频样本。
2、使用合适的频谱分析方法，例如短时傅里叶变换(Short-Time Fourier Transform,STFT)或梅尔频谱分析(MelSpectrogram)，将音频信号转换为频谱表示。
3、设计一种有效的音频指纹提取算法，将频谱表示转换为紧凑且具有唯一性的音频指纹特征。
4、选择合适的匹配算法，例如哈希函数或相似度计算方法，用于在数据库中快速匹配和识别音频指纹。
5进行实验评估，测试系统在不同噪声和变形条件下的识别性能，并进行性能优化。
```
### 项目安装软件
- 安装python3.11.4
- 执行pip install requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- mac、ubuntu 安装ffmpeng
```
brew install ffmpeg  # MacOS
sudo apt-get install ffmpeg  # Ubuntu
```
- win 安装ffmpeng
```
1.打开FFmpeg官方下载页面：https://www.ffmpeg.org/download.html。在"Windows builds"栏目下，点击"get packages link"，在这里我选择的是gpgkey的站点。
2.选择合适你的Windows系统（32-bit或64-bit， 大部分现在是64-bit）的"Static"版本下载。下载文件是一个.zip压缩包。
3.下载完成后，解压这个.zip文件。建议将解压后的文件夹放置在一个不会轻易删除和移动的位置，比如C:\目录下。
4.然后进行环境变量设置。右键点击电脑-->属性-->高级系统设置-->环境变量。在系统变量中找到"Path"，点击编辑，将解压的文件夹中bin目录的地址添加进去。
例如，如果你将文件解压在了C:\目录下，文件夹名为ffmpeg，那么你应该添加的地址就是C:\ffmpeg\bin
5.最后，验证是否安装成功，在"开始" --> "运行" 中输入"cmd" 打开命令行，输入ffmpeg，如果出现ffmpeg的相关信息，则说明安装成功。
```
## 目录说明
-- 参考  参考资料
--source 资源文件
--.gitignore 忽略文件
--autio_fingerprints.db  音频数据库会自动创建
--get_voice_figer.py  获取音频数据，并根据算法存储到数据库中
--requirement.py  安装需要的文件
--voice_to_picture.py 将音频转成图片

├── audio_fingerprints.db 匹配数据库
├── get_voice_figer.py  将声音指纹转成指纹并存储到数据库，并拿起它声音进行匹配
├── get_voice_figer_detail.py 将声音指纹转成指纹并存储到数据库，并拿起它声音进行匹配，涉及到峰值列表算法，不是很完善，存储数据库时间过长
├── voice_to_picture.py  将声音转成图片
├── requirement.txt 安装依赖
├── source
│   ├── wav
│   │   ├── 王菲.wav
│   │   ├── 林俊杰.wav
│   │   ├── 薛之谦.wav
│   │   └── 薛凯琪.wav
│   ├── 王菲.mp3
│   ├── 方大同.mp3
│   ├── 林俊杰.mp3
│   ├── 薛之谦.mp3
│   ├── 薛凯琪.mp3
│   └── 邓紫棋.mp3
└── 参考
    ├── 基于功率谱特征的音频指纹实现_鲁明明.pdf
    ├── 基于音频指纹的压缩域音频识别方法研究_明建成.pdf
    └── 音频指纹提取方法在多媒体信息识别中的应用研究_宋文喆.pdf