# Multi_label_classification **Repository Path**: zhangbeibei_page/Multi_label_classification ## Basic Information - **Project Name**: Multi_label_classification - **Description**: 以多罪名预测任务为导向,建立以 Seq2Seq+attention、Transformer 等为基础的序列生成模型,完成在 RCV1-V2、AAPD 等多标签数据集上的模型训练及使用。 - **Primary Language**: Python - **License**: LGPL-2.1 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-08-19 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Multi_label_classification 以多罪名预测任务为导向,建立以 Seq2Seq+attention、Transformer 等为基础的序列生成模型,完成在 RCV1-V2、AAPD 等多标签数据集上的模型训练及使用。 考虑到罪名标签空间大,标签之间存在关联性,传统以 Binary Relevance、Classifier Chains、Label Powerset 为代表的模型不再适用当前任务,我们从机器翻译角度,将多罪名预测任务转换成序列生成任务,并取得良好效果,在 Baseline 平均 F1 值 0.645 的基础上,我们的模型 F1 值达到了 0.68。 ### 数据预处理 daset地址:https://pan.baidu.com/s/1TfqIkiiLqqYW21m-tELF_Q 提取码:jp5h 解压后放入data文件夹下,运行data/data_preprocess.py ### 训练并保存模型 model/seq2seq.py ### 加载模型并预测 predict/predict.py ### 指标计算 predict/metric_compute.py