# recoProxy **Repository Path**: wenhuawang/recoProxy ## Basic Information - **Project Name**: recoProxy - **Description**: 一个基于讯飞语音听写的实时语音识别的仓库 - **Primary Language**: C++ - **License**: Unlicense - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 2 - **Created**: 2021-01-21 - **Last Updated**: 2024-05-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # recoProxy #### 介绍 一个基于讯飞语音听写的实时语音识别的仓库 #### 软件架构 软件架构说明 本仓库提供了一个基于google webrtc VAD + 讯飞语音听写的SDK, 供人们快速开发实时转写、离线转写的SDK。 编译后的api目录 包含 api.h 头文件 librecoProxy.so 动态库 libs 其他依赖库等 本SDK一共提供了3个接口和一个结果获取的回调接口。 创建接口用于创建一个实体。 填数据结构,持续向实体填PCM数据 然后通过回调接口回送识别结果 最后会话结束,调用释放接口,等待结果处理完毕。 1)创建接口 void* pCreateRecoProxy(const char* pUuid,int iUuidLen,void* pCbObj, vadOptions* pVadOptions, asrOptions* pAsrOptions, getResCb pCbfunc); 2)填数据结构 void pFeedDataToRecoProxy(void* pRecoProxy,char* pData, int iLen); 3)释放接口 void pCloseRecoProxy(void* pRecoPproxy); 4) 回调接口 typedef int (*getResCb) (void* pCbObj, asrMsg* pMsg, int iIsFinal); #### 安装教程 1. cd build/debug 编译debug 版本,如需release, cd build/release 2. 运行 sh build.sh 3. cd example 目录 4. sh build.sh 5. 设置环境变量 RECO_VAD_APPID、RECO_VAD_APIKEY、RECO_VAD_APISECRET 6. 运行 ./test2 看到类似于下面的输出 command is 0 Index : 3 asr res is 语音听写可以将语音转为文字。 BeginTime is 11479 ms file = /tmp//test123_0003.pcm 证明工作正常。 #### 使用说明 环境变量: RECO_VAD_APPID 讯飞账号AppID RECO_VAD_APIKEY 讯飞账号ApiKey RECO_VAD_APISECRET 讯飞账号 ApiSecret #### 依赖库 1,google webrtc 库里面的 VAD 部分 2,rapidjson 3,websocketpp 4,spdlog 5,pbkdf2-hmac-sha256 不足: 目前采用的ws,还没有支持wss等 最后一句如果通话只有开始没有结束,需要Improvement #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request