# 科大讯飞_event_extraction_2020_Top1
**Repository Path**: firework__han/xf_event_extraction2020Top1
## Basic Information
- **Project Name**: 科大讯飞_event_extraction_2020_Top1
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 3
- **Created**: 2020-12-02
- **Last Updated**: 2023-05-11
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# XF-Event-Extraction
2020
科大讯飞事件抽取挑战赛
比赛链接:http://challenge.xfyun.cn/topic/info?type=hotspot
结果:
| Name     | Score |  Rank|Team member| 
| :--------|:------|:----|:----------|
|我是蛋糕王 | 0.73859| 1   |https://github.com/WuHuRestaurant
https://github.com/aker218|
事件抽取系统,包含触发词(trigger),事件论元(role),事件属性(attribution)的抽取。基于 pytorch 的 pipeline 解决方案。
## 主要思路
将任务分割为**触发词抽取**,**论元抽取**,**属性抽取**。具体而言是论元和属性的抽取结果依赖于**触发词**,因此只有一步误差传播。**因 time loc 并非每个句子中都存在,并且分布较为稀疏,因此将 time & loc 与 sub & obj 的抽取分开(role1 提取 sub & obj;role2 提取 time & loc)**
模型先进行**触发词提取**,由于复赛数据集的特殊性,模型限制抽取的事件仅有一个,**如果抽取出多个触发词,选择 logits 最大的 trigger 作为该句子的触发词**,如果没有抽取触发词,筛选整个句子的 logits,取 argmax 来获取触发词;
然后根据触发词抽取模型抽取的触发词,分别输入到 role1 & role2 & attribution 模型中,进行后序的论元提取和属性分类;四种模型都是基于 Roberta-wwm 进行实验,加入了不同的特征。
最后将识别的结果进行整合,得到提交文件。
### pipeline 思路如下:




