# joffice

**Repository Path**: rmshadows/joffice

## Basic Information

- **Project Name**: joffice
- **Description**: 基于Java的跨平台办公辅助套件
- **Primary Language**: Java
- **License**: GPL-3.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 0
- **Created**: 2021-05-09
- **Last Updated**: 2022-06-13

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# joffice

### 介绍
基于Java的跨平台办公辅助套件

### 平台

Linux、Windows

### 使用说明

#### Vosk——离线语音识别

概述：Vosk是一款开源的离线语音识别框架。

Vosk语音识别文件格式：wav格式，采样率16k，位深16bit，单声道。

使用前的准备：

1. 从 https://alphacephei.com/vosk/models 上下载语音识别模型，解压后重命名为`model_（你自定义的名称）`。
2. 新建`conf`文件夹，在`conf`文件夹中新建配置文件`00-vosk.conf`。配置文件格式(用等于号分割)：“`【语音识别模型名称】=【语音识别模型路径】`”。比如：我下载了一个中文识别模型，解压重命名为“`model_zh`”，放置于`res`目录下。再新建一个“`00-vosk.conf`”配置文件于`conf`目录下。
3. “`00-vosk.conf`”配置文件内容是：`中文=res/model_zh`。这样，Joffice Vosk界面的模型选择中就会显示 `中文` 这个模型啦。
4. 功能指南：
   - 1.Vosk识别：识别麦克风的语音。
   - 2.文件识别：识别文件。需要将文件路径写在文本框中，例如：`/home/user/file.wav`。注意：音频要求**采样率16k，位数16，单声道，音频格式wav**。鼠标主键单线程识别，副键单文件多线程识别（正确率降低）。
   - 3.一键复制：复制文本框中的内容。
   - 4.清空：清空文本框。
   - 5.选择模型：选择识别模型（`conf/00-vosk.conf`中设定的`「自定义模型名称」=「模型路径」`）
   - 6.选择设备：选择特定的麦克风输入。
   - 7.拖拽功能：支持拖拽多个文件，每个文件一个线程进行识别。
5. 其他：如果Linux上文本框无法输入中文，请在java运行参数中加入：-Djdk.gtk.version=2

#### 百度语音识别——在线语音识别

百度语音识别文件格式：60 秒以下的`pcm`、`wav`、`amr`、`m4a`，采样率 `16000`、`8000`，`16 bit` 位深，单声道。建议采用wav格式，采样率16k，位深16bit，单声道 。

使用前的准备：

1. 前往百度AI官网登录或者注册帐号：https://ai.baidu.com/

2. 进入[控制台](https://console.bce.baidu.com/?fromai=1#/aip/overview)-语音识别，新建语音识别应用。然后购买语音识别包（比较贵）或者按量计费（推荐）。按量计费单次调用费用不高，如果你不是经常用语音识别，充值个十块就可以用好久了。

3. 记录下`APP_ID`、`APP_KEY`、`SECRET_KEY`。填写`conf/01-baidu_ai.conf`文件：

   ```
   # 你的APP ID
   APP_ID=43548423
   # 你的APP 密钥
   APP_KEY=kVcnfD9iW2XVZSMaLMrtLYIz
   # 你的APP 安全密钥
   SECRET_KEY=O9o1O213UgG5LFn0bDGNtoRN3VWl2du6
   ```

4. 如果识别出错，错误码在 [这里](https://ai.baidu.com/ai-doc/SPEECH/Yk4o0bkop) 可以查询到。

5. 功能指南：

   - 麦克风识别： 主键单次识别不超过60秒，副键识别不超过一小时。
   - 识别文件：可拖拽识别。
   - 一键复制：一键复制文本。
   - 一键清除：清空文本框。
   - 帮助/属性：主键显示此文本，副键显示音频属性。
   - 选择模型：选择识别模型（`conf/01-baidu_ai.conf`中设定的`「自定义模型名称」=「模型路径」`）
   - 选择设备：选择特定的麦克风输入。
   - 拖拽功能：支持拖拽多个文件，所有文件一个线程进行识别。

### 发行说明

仅发布Lite版本，Lite版本无法开箱即用！

下面是开箱即用指南：

1. 安装JDK: 必装

   - 如果你已经有安装JDK：直接修改`Head.bat`（Linux是`sh`结尾）文件中的`SPECIFY_JDK_HOME`参数。

   - 如果你没有安装JDK（Java Development Kit），请到Oracle官网[下载](https://www.oracle.com/java/technologies/javase-downloads.html)（Java11及以上版本）。下载完后，解压，将里面的`bin`等文件夹放到`windows`（Linux则是`linux`文件夹）文件夹中的`jdk`文件夹中。

     ```
     此时的目录结构是：
     ├── jdk
     │   ├── bin
     │   ├── conf
     │   ├── COPYRIGHT
     │   ├── include
     │   ├── jmods
     │   ├── legal
     │   ├── lib
     │   ├── README.html
     │   └── release
     ```

2. 安装ffmpeg：选装 - 需要使用语音识别的需要安装

   - （这里是Windows教程，Linux同理）到[ffmpeg官网](https://ffmpeg.org/download.html)下载二进制文件，解压放到相对应的目录下（`res`文件夹中的`windows`文件夹的`ffmpeg`）。

     ```
     此时的目录结构是：
     res
     ├──Windows
         ├── ffmpeg
         │   ├── bin
         │   ├── doc
         │   ├── LICENSE
         │   ├── presets
         │   └── README.txt
         └── jvad
             ├── cyggcc_s-seh-1.dll
             ├── ...
     ```

3. 接下来，按照使用说明中的功能介绍操作即可。

### 更新日志

- 2021.08.23——1.0.7
  - 发布了1.0.7版本
  - 添加了版本号
  - 修复了vosk下同名wav文件无法转换的问题
- 2021.08.21——1.0.6
  - 修复了语音识别切换功能后不停止的问题
- 2021.08.19——1.0.5
  - 修复了百度麦克风仅在后台识别的bug

 * 2021.08.18——1.0.4
    * 完成了百度麦克风识别
 * 2021.08.14——1.0.3
    * 完成了百度拖拽识别功能
 * 2021.08.12——1.0.2
    * 解决了百度语音识别Jvad文件乱序问题
 * 2021.07.25——1.0.1
    * VoskUtil在Windows停用vad4j
 * 2021.05.19——1.0.0
    * 完成了Vosk主体框架