# nlp_machine_translation

**Repository Path**: cxxgit/nlp_machine_translation

## Basic Information

- **Project Name**: nlp_machine_translation
- **Description**: 自然语言处理一个机器翻译系统后端，该系统能够实现自然语言处理中语种识别、拼写纠错、机器翻译、句子分词、成语翻译、提取关键词功能。
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 3
- **Forks**: 2
- **Created**: 2023-07-04
- **Last Updated**: 2024-05-05

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 项目名称

自然语言处理一个机器翻译系统后端，该系统能够实现自然语言处理中语种识别、拼写纠错、机器翻译、句子分词、成语翻译、提取关键词功能。

## 环境配置

为了正确地配置项目环境，请按照以下步骤进行操作：
(基础python环境为python==3.8.0)
1. 打开终端并进入项目目录。
2. 在终端中运行以下命令，根据提供的`requirements.txt`文件安装所需的环境和依赖项：

```bash
pip install "path\to\torch\torch-1.12.1+cu113-cp38-cp38-win_amd64.whl"
pip install "path\to\torch\torchvision-0.13.1+cu113-cp38-cp38-win_amd64.whl"
pip install -r requirements.txt
```
3. 若电脑不支持yarn指令(前端代码需要)，则运行以下命令安装yarn
```bash
pip install yarn
```

## 模型训练

要训练机器翻译模型，请执行以下步骤：

1. 确保已完成环境配置。
2. 运行 `run.py` 文件，该文件将启动模型训练过程。

## 参数设置

您可以根据您的需求，在 `parsee.py` 文件中进行参数设置。以下是一些常用参数的示例：

- 训练集路径：在 `parsee.py` 文件中设置训练集路径参数，以指定用于训练的数据集。

```python
train_file = "path/to/train_dataset.txt"
```

- 其他参数：根据您的需要，您可以在 parsee.py 文件中设置其他参数，如批大小、训练轮数等。

```
batch_size = 64
epochs = 5
```
## 数据库安装

如果您需要使用数据库功能，请按照以下步骤进行安装和配置：

1. 安装 MySQL 数据库：推荐版本为 8.0.27。您可以从 MySQL 官方网站下载并安装适合您操作系统的版本。

2. 安装 Navicat Premium 15：Navicat 是一款用于数据库管理的工具，您可以从官方网站下载并安装 Navicat Premium 15。

3. 导入数据库：使用 Navicat 打开数据库，执行提供的 SQL 文件，将数据库导入到本地。

   > 注意：如果您不需要使用数据库功能，可以在 `parsee.py` 文件中将 `database` 参数设置为 `False`。

## Demo 使用

要使用项目的演示功能，请按照以下步骤操作：

1. 确保已完成环境配置。
2. 运行 `all.py` 文件，该文件将启动后端服务。
3. 根据位于 `machine_translation` 目录中的 `readme.md` 文件的说明，配置并启动前端环境。

完成上述步骤后，您将能够使用机器翻译系统的演示功能。