# joffice **Repository Path**: rmshadows/joffice ## Basic Information - **Project Name**: joffice - **Description**: 基于Java的跨平台办公辅助套件 - **Primary Language**: Java - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-05-09 - **Last Updated**: 2022-06-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # joffice ### 介绍 基于Java的跨平台办公辅助套件 ### 平台 Linux、Windows ### 使用说明 #### Vosk——离线语音识别 概述:Vosk是一款开源的离线语音识别框架。 Vosk语音识别文件格式:wav格式,采样率16k,位深16bit,单声道。 使用前的准备: 1. 从 https://alphacephei.com/vosk/models 上下载语音识别模型,解压后重命名为`model_(你自定义的名称)`。 2. 新建`conf`文件夹,在`conf`文件夹中新建配置文件`00-vosk.conf`。配置文件格式(用等于号分割):“`【语音识别模型名称】=【语音识别模型路径】`”。比如:我下载了一个中文识别模型,解压重命名为“`model_zh`”,放置于`res`目录下。再新建一个“`00-vosk.conf`”配置文件于`conf`目录下。 3. “`00-vosk.conf`”配置文件内容是:`中文=res/model_zh`。这样,Joffice Vosk界面的模型选择中就会显示 `中文` 这个模型啦。 4. 功能指南: - 1.Vosk识别:识别麦克风的语音。 - 2.文件识别:识别文件。需要将文件路径写在文本框中,例如:`/home/user/file.wav`。注意:音频要求**采样率16k,位数16,单声道,音频格式wav**。鼠标主键单线程识别,副键单文件多线程识别(正确率降低)。 - 3.一键复制:复制文本框中的内容。 - 4.清空:清空文本框。 - 5.选择模型:选择识别模型(`conf/00-vosk.conf`中设定的`「自定义模型名称」=「模型路径」`) - 6.选择设备:选择特定的麦克风输入。 - 7.拖拽功能:支持拖拽多个文件,每个文件一个线程进行识别。 5. 其他:如果Linux上文本框无法输入中文,请在java运行参数中加入:-Djdk.gtk.version=2 #### 百度语音识别——在线语音识别 百度语音识别文件格式:60 秒以下的`pcm`、`wav`、`amr`、`m4a`,采样率 `16000`、`8000`,`16 bit` 位深,单声道。建议采用wav格式,采样率16k,位深16bit,单声道 。 使用前的准备: 1. 前往百度AI官网登录或者注册帐号:https://ai.baidu.com/ 2. 进入[控制台](https://console.bce.baidu.com/?fromai=1#/aip/overview)-语音识别,新建语音识别应用。然后购买语音识别包(比较贵)或者按量计费(推荐)。按量计费单次调用费用不高,如果你不是经常用语音识别,充值个十块就可以用好久了。 3. 记录下`APP_ID`、`APP_KEY`、`SECRET_KEY`。填写`conf/01-baidu_ai.conf`文件: ``` # 你的APP ID APP_ID=43548423 # 你的APP 密钥 APP_KEY=kVcnfD9iW2XVZSMaLMrtLYIz # 你的APP 安全密钥 SECRET_KEY=O9o1O213UgG5LFn0bDGNtoRN3VWl2du6 ``` 4. 如果识别出错,错误码在 [这里](https://ai.baidu.com/ai-doc/SPEECH/Yk4o0bkop) 可以查询到。 5. 功能指南: - 麦克风识别: 主键单次识别不超过60秒,副键识别不超过一小时。 - 识别文件:可拖拽识别。 - 一键复制:一键复制文本。 - 一键清除:清空文本框。 - 帮助/属性:主键显示此文本,副键显示音频属性。 - 选择模型:选择识别模型(`conf/01-baidu_ai.conf`中设定的`「自定义模型名称」=「模型路径」`) - 选择设备:选择特定的麦克风输入。 - 拖拽功能:支持拖拽多个文件,所有文件一个线程进行识别。 ### 发行说明 仅发布Lite版本,Lite版本无法开箱即用! 下面是开箱即用指南: 1. 安装JDK: 必装 - 如果你已经有安装JDK:直接修改`Head.bat`(Linux是`sh`结尾)文件中的`SPECIFY_JDK_HOME`参数。 - 如果你没有安装JDK(Java Development Kit),请到Oracle官网[下载](https://www.oracle.com/java/technologies/javase-downloads.html)(Java11及以上版本)。下载完后,解压,将里面的`bin`等文件夹放到`windows`(Linux则是`linux`文件夹)文件夹中的`jdk`文件夹中。 ``` 此时的目录结构是: ├── jdk │   ├── bin │   ├── conf │   ├── COPYRIGHT │   ├── include │   ├── jmods │   ├── legal │   ├── lib │   ├── README.html │   └── release ``` 2. 安装ffmpeg:选装 - 需要使用语音识别的需要安装 - (这里是Windows教程,Linux同理)到[ffmpeg官网](https://ffmpeg.org/download.html)下载二进制文件,解压放到相对应的目录下(`res`文件夹中的`windows`文件夹的`ffmpeg`)。 ``` 此时的目录结构是: res ├──Windows ├── ffmpeg │   ├── bin │   ├── doc │   ├── LICENSE │   ├── presets │   └── README.txt └── jvad ├── cyggcc_s-seh-1.dll ├── ... ``` 3. 接下来,按照使用说明中的功能介绍操作即可。 ### 更新日志 - 2021.08.23——1.0.7 - 发布了1.0.7版本 - 添加了版本号 - 修复了vosk下同名wav文件无法转换的问题 - 2021.08.21——1.0.6 - 修复了语音识别切换功能后不停止的问题 - 2021.08.19——1.0.5 - 修复了百度麦克风仅在后台识别的bug * 2021.08.18——1.0.4 * 完成了百度麦克风识别 * 2021.08.14——1.0.3 * 完成了百度拖拽识别功能 * 2021.08.12——1.0.2 * 解决了百度语音识别Jvad文件乱序问题 * 2021.07.25——1.0.1 * VoskUtil在Windows停用vad4j * 2021.05.19——1.0.0 * 完成了Vosk主体框架