# R_conll2003 **Repository Path**: tooyeer/R_conll2003 ## Basic Information - **Project Name**: R_conll2003 - **Description**: DL_CONLL2003 - **Primary Language**: Unknown - **License**: AGPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2022-01-14 - **Last Updated**: 2025-05-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: 深度学习, LSTM, conll2003 ## README # 对CONLL2003数据集的一点探索 ## 用于研究conll2003数据集的项目 ### img文件夹存放主要模型与数据集相关信息 ### data文件夹下存放conll2003数据集 ### model文件夹下存放数据集词典和模型参数 ### AttentionDecoder.py:注意力机制 ### load_data.py: 文件读取 ### Bi_LSTM_Model.py :模型搭建与训练预测 ![README/img.png](README/img.png) ## 数据集情况 ### 句子长度及出现频数统计图 ![README/句子长度及出现频数统计图.png](README/句子长度及出现频数统计图.png) ### 句子长度累积分布函数图 ![README/句子长度累积分布函数图.png](README/句子长度累积分布函数图.png) ## 基础模型情况 ### 模型结构 ![README/img_2.png](README/img_2.png) ### 模型效果 ![README/img_3.png](README/img_3.png) ### 训练曲线 ![README/img_4.png](README/img_4.png) ![README/img_5.png](README/img_5.png) ## 模型升级版 ### 扩大模型宽度和深度、增加Dropout、添加CRF。 ### 用于更复杂的命名实体识别任务 ![img.png](README/img_6.png)