# SpeechRecognitionInterface

**Repository Path**: whd_cool/speech-recognition-interface

## Basic Information

- **Project Name**: SpeechRecognitionInterface
- **Description**: 针对语音识别模型whisper的SpringBoot的一个接口整合
- **Primary Language**: Unknown
- **License**: MulanPSL-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2023-09-27
- **Last Updated**: 2023-10-07

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# SpeechRecognitionInterface

#### 介绍
针对语音识别模型whisper的SpringBoot的一个接口整合

#### 软件架构
软件架构说明


#### 安装教程

##### 安装或升级python 3.9.1

```
#如果升级安装过程有问题，可以执行下面命令
yum update -y

yum -y groupinstall "Development tools"
 
yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel psmisc libffi-devel
```

```
mkdir /opt/python3

cd /opt/python3

#下载
wget https://www.python.org/ftp/python/3.9.1/Python-3.9.1.tgz

#解压
tar -xzf Python-3.9.1.tgz

#编译安装
cd Python-3.9.1

./configure --prefix=/usr/local/python3

make && make install

#修改系统路径和指向
#先移动或者备份
 mv /usr/bin/python /usr/bin/python_old
 mv /usr/bin/pip /usr/bin/pip_old
 
#配置系统连接和路径指针
ln -s /usr/local/python3/bin/python3.9 /usr/bin/python
ln -s /usr/local/python3/bin/pip3.9 /usr/bin/pip

#检查版本
python -V

#修改yum使用的python版本 yum使用python3会出错
#这两个文件第一行最后python改为python2即可
vi /usr/bin/yum
vi /usr/libexec/urlgrabber-ext-down


#若有升级pip的需要
python -m pip install --upgrade pip -i https://pypi.douban.com/simple
```

##### 安装pytorch

```
官网 查找版本  gpu更适合深度学习
https://pytorch.org/get-started/locally/
#cpu
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cpu


#win10 
#英伟达显卡安装cuda
https://www.ngui.cc/el/3180290.html?action=onClick

#cuda安装教程
https://blog.csdn.net/m0_45447650/article/details/123704930
#去官网找显卡适合的对应版本安装torch


#查看
nvcc --version
set cuda
#测试是否成功 返回为true为成功
python
import torch
torch.cuda.is_available()

#显卡用于深度学习的优化   我全部选择了11.8版本
https://developer.nvidia.com/cuda-toolkit-archive
```


##### 安装whisper

```text
#官方安装
pip install -U openai-whisper
#或者，以下命令将从此存储库中提取并安装最新的提交及其 Python 依赖项：
pip install git+https://github.com/openai/whisper.git 
#要将软件包更新到此存储库的最新版本，请运行：
pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git

#或利用清华或豆瓣源安装
pip install -i https://pypi.doubanio.com/simple/ openai-whisper 
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple +包名

#如果安装成功但提示命令不存在则添加环境变量
export PATH="/usr/local/python3/bin:$PATH"

```

##### **安装ffmpeg**  编译安装

```
windows环境  官网 下载http://ffmpeg.org/
到FFmpeg官网（ffmpeg.org）的“Download”页面选择Windows图标，选择“Windows build from gyan.dev”，然后在“release builds”下选择“ffmpeg-release-full-shared.7z”。

只需要解压Bin文件夹内的文件，解压出Bin文件夹下的EXE和DLL后，您需要把它们所在的路径加入PATH
```

linux:

```
git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg


#然后进入ffmpeg文件夹，依次执行下列语句，当然连起来也可以：
cd ffmpeg
./configure
make
make install

#时间较长，不出意外会正常安装好。
#但是因为configure时候没有指定路径，所以直接ffmpeg会提示找不到。
#所以要将编译好的ffmpeg复制到bin目录即可：

cp ffmpeg /usr/bin/ffmpeg

#然后检查版本

ffmpeg -version

#可能编译时会出错 nasm/yasm not found or too old. Use --disable-x86asm for a crippled build.
#yasm是汇编编译器，ffmpeg为了提高效率使用了汇编指令，如MMX和SSE等。所以系统中未安装yasm时，就会报上面错误。
#则需要安装
wget http://www.tortall.net/projects/yasm/releases/yasm-1.3.0.tar.gz

tar -zxvf yasm-1.3.0.tar.gz 

cd yasm-1.3.0

./configure
make
make install

```

##### 使用说明

```
whisper -h 有参数说明
```