# code_nlp

**Repository Path**: uglyghost123/code_nlp

## Basic Information

- **Project Name**: code_nlp
- **Description**: 西南财经大学-自然语言处理课程-第二章课程作业
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 2
- **Forks**: 0
- **Created**: 2023-09-20
- **Last Updated**: 2024-10-11

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

项目 README 文件介绍：

本项目是自然语言处理课程作业项目，旨在通过修改提示词文件来提升模型性能。项目包含三个子任务：情绪分析（emotion）、分词（tokenization）、和翻译（translation）。每个子任务都有一个主运行脚本、提示词文件和环境需求文件。同学们需要关注于修改prompt文件中的提示语，以提升模型的输出性能。以下是项目的详细介绍和使用说明：

### 文件结构
```
├── emotion
│   ├── emotion.py (主运行脚本)
│   ├── prompt (提示词文件)
│   └── requirement.txt (环境依赖文件)
├── tokenization
│   ├── tokenization.py (主运行脚本)
│   ├── prompt (提示词文件)
│   ├── pku_training.utf8 (数据集)
│   └── requirement.txt (环境依赖文件)
└── translation
    ├── translation.py (主运行脚本)
    ├── prompt (提示词文件)
    ├── news-commentary-v13.zh-en.en (英语翻译数据集)
    ├── news-commentary-v13.zh-en.zh (中文翻译数据集)
    └── requirement.txt (环境依赖文件)
```

### 环境配置
1. 将Python包源设置为清华源，以加速包的安装速度：
   ```
   pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
   ```
2. 根据各子任务的`requirement.txt`文件安装所需的Python包。例如：
   ```
   pip install -r requirement.txt
   ```

### 任务执行步骤
请同学们按如下步骤处理每个任务，需要注意的是，每个任务的主运行脚本都需要配置API_KEY：

### 1. 情感分析任务（Emotion Task）

#### 步骤：

1. 访问 https://open.bigmodel.cn 以申请API_KEY。
2. 在`emotion.py`脚本中按照说明填写已获得的API_KEY。
3. 使用以下命令来运行情绪分析任务的脚本：
   ```
   python emotion.py
   ```
4. 适当修改`prompt`文件中的提示词，提高模型的准确度。
5. （可选）更改`emotion.py`脚本中的模型参数或尝试使用不同类型的模型（脚本中第16到21行）来实验提升性能。

#### 结果输出示例
![image](https://github.com/uglyghost/code_nlp/assets/15159177/48a32dd7-5645-4d45-ad62-b340dfc1c1d0)


### 2. 分词任务（Tokenization Task）

#### 步骤：

1. 访问 https://open.bigmodel.cn 以申请API_KEY。
2. 在`tokenization.py`脚本中按照说明填写已获得的API_KEY。
3. 使用以下命令来运行分词任务的脚本：
   ```
   python tokenization.py
   ```
4. 尝试修改`prompt`文件中的提示词，以提升模型的性能。
5. （可选）同学们可以更改`tokenization.py`脚本中的模型参数或尝试使用不同类型的模型（脚本中第57到62行）进行实验。

#### 结果输出示例
![image](https://github.com/uglyghost/code_nlp/assets/15159177/1dc434e1-9056-4422-b7ff-632740017632)


### 3. 翻译任务（Translation Task）

#### 步骤：

1. 访问 https://open.bigmodel.cn 以申请API_KEY。
2. 在`translation.py`脚本中按照说明填写已获得的API_KEY。
3. 使用以下命令来运行翻译任务的脚本：
   ```
   python translation.py
   ```
4. 适当调整`prompt`文件中的提示词，尝试提升模型的性能。
5. （可选）同学们可以尝试更改`translation.py`脚本中的模型参数或使用不同类型的模型（脚本中第28到33行）进行实验，以寻找最佳性能配置。

#### 结果输出示例
![image](https://github.com/uglyghost/code_nlp/assets/15159177/2f03f9aa-3589-426f-b675-c45cb7a66587)


### 作业目标
- 运行主脚本后，系统将输出模型的性能结果。同学们应尽可能调整提示词（prompt），或调整模型参数及更换模型来提高性能。

希望这份指南能够为同学们提供清晰和详细的步骤指导，祝同学们完成课程作业顺利！