# hkxcd_text_clf **Repository Path**: syshensyshen/hkxcd_text_clf ## Basic Information - **Project Name**: hkxcd_text_clf - **Description**: No description available - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-02-22 - **Last Updated**: 2021-03-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # hkxcd_text_clf ## 介绍 航空行程单结构化模型,模型包含 RNN + XGB 两部分 ## 软件架构 ![image](https://gitee.com/smzy455/hkxcd_text_clf/raw/master/config/frame.jpg) ## 使用说明 #### 特征工程: 对航空行程单json原始数据进行数据清洗、构建两个特征数据集df_rnn_data.csv、df_xgb_data.csv cd ./data python deal_hkxcd.py #### word2vec向量模型: 搜狗实验室新闻数据训练构建词向量模型 (https://www.sogou.com/labs/resource/ca.php) cd ./word2vec_model python word2vec_training.py ### training & inference config.py 训练: is_need_train = True 推理: is_need_train = False python xgb_infer.py