# final_project_code_result **Repository Path**: liam1030/final_project_code_result ## Basic Information - **Project Name**: final_project_code_result - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-01-12 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # CSDA Final Project- 说明 ## 数据处理 1.详情见pre-processing_mydata.ipynb 2.bert框架下输入数据使用tsv格式,无需进行分词 3.其他模型框架下输入数据使用csv格式,需先进行分词 4.可训练w2v或使用预训练的w2v ## 模型训练 ### Bert 1.训练bert使用谷歌开源框架https://github.com/google-research/bert 2.首先下载中文预训练,在使用自己的数据训练分类器,详情见 models/bert ### CNN\attention+BiLSTM/Adversarial Training 详情见models; 单模型代码架构见Text-classification.png ### 模型融合 详情见models/ensemble.py 尝试用attention训练融合权重,可收敛,但是数量太少,还没进行最后效果测试。详情见ensemble&attention_weights.py