# nlp_machine_translation **Repository Path**: cxxgit/nlp_machine_translation ## Basic Information - **Project Name**: nlp_machine_translation - **Description**: 自然语言处理一个机器翻译系统后端,该系统能够实现自然语言处理中语种识别、拼写纠错、机器翻译、句子分词、成语翻译、提取关键词功能。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 2 - **Created**: 2023-07-04 - **Last Updated**: 2024-05-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 项目名称 自然语言处理一个机器翻译系统后端,该系统能够实现自然语言处理中语种识别、拼写纠错、机器翻译、句子分词、成语翻译、提取关键词功能。 ## 环境配置 为了正确地配置项目环境,请按照以下步骤进行操作: (基础python环境为python==3.8.0) 1. 打开终端并进入项目目录。 2. 在终端中运行以下命令,根据提供的`requirements.txt`文件安装所需的环境和依赖项: ```bash pip install "path\to\torch\torch-1.12.1+cu113-cp38-cp38-win_amd64.whl" pip install "path\to\torch\torchvision-0.13.1+cu113-cp38-cp38-win_amd64.whl" pip install -r requirements.txt ``` 3. 若电脑不支持yarn指令(前端代码需要),则运行以下命令安装yarn ```bash pip install yarn ``` ## 模型训练 要训练机器翻译模型,请执行以下步骤: 1. 确保已完成环境配置。 2. 运行 `run.py` 文件,该文件将启动模型训练过程。 ## 参数设置 您可以根据您的需求,在 `parsee.py` 文件中进行参数设置。以下是一些常用参数的示例: - 训练集路径:在 `parsee.py` 文件中设置训练集路径参数,以指定用于训练的数据集。 ```python train_file = "path/to/train_dataset.txt" ``` - 其他参数:根据您的需要,您可以在 parsee.py 文件中设置其他参数,如批大小、训练轮数等。 ``` batch_size = 64 epochs = 5 ``` ## 数据库安装 如果您需要使用数据库功能,请按照以下步骤进行安装和配置: 1. 安装 MySQL 数据库:推荐版本为 8.0.27。您可以从 MySQL 官方网站下载并安装适合您操作系统的版本。 2. 安装 Navicat Premium 15:Navicat 是一款用于数据库管理的工具,您可以从官方网站下载并安装 Navicat Premium 15。 3. 导入数据库:使用 Navicat 打开数据库,执行提供的 SQL 文件,将数据库导入到本地。 > 注意:如果您不需要使用数据库功能,可以在 `parsee.py` 文件中将 `database` 参数设置为 `False`。 ## Demo 使用 要使用项目的演示功能,请按照以下步骤操作: 1. 确保已完成环境配置。 2. 运行 `all.py` 文件,该文件将启动后端服务。 3. 根据位于 `machine_translation` 目录中的 `readme.md` 文件的说明,配置并启动前端环境。 完成上述步骤后,您将能够使用机器翻译系统的演示功能。