自己先后尝试了4个版本去测试,essay_scoring_V5是比较完整的版本,其中包含了:
基于现成的 N-gram 字典对作文抽取语法正确性特征。该字典使用英文维基百科语料,统计其中的 3-gram、4-gram、5-gram 词汇组合及其对应的词频。构建作文语法正确性特征的过程如下: a.读取维基百科的 N-gram 数据,将其转化成字典格式。 b.对作文文本进行分句、分词等预处理工作。 c.对作文分词后的词汇集合,分别设定 3、4、5 为窗口大小,得到不同窗口大小下的 n-gram 文本。 d.根据维基百科的 3-gram、4-gram、5-gram 字典,对作文的 n-gram 文本集合进行统计。
这段时间来自己一直在阅读作文自动评分与简答题自动评分相关的论文,总共阅读了大概40+,大部分为国内硕士论文,现将论文方法整理如下,供之后借鉴:
简答题自动评分主要是计算学生答案与参考答案之间的相似度,我整理了作文中常见的相似度计算方法,而大部分论文的方法都是把这些相似度特征分别乘以各自的权重,进而得到句子或段落的相似度特征;我认为之后可以分析不同科目的简答题特征,融合多种算法并进行定制化改进来完成简答题自动评分。
这里的wordonce 表示在A和B中仅出现过一次的词语
张胜楠. 基于文本相似度的短文本主观题自动评分方法研究[D].武汉理工大学,2017._
何恒飞. 主观题智能阅卷的关键技术研究[D].北京工业大学,2013.
_孟爱国,卜胜贤,李鹰,甘文.一种网络考试系统中主观题自动评分的算法设计与实现[J].计算机与数字工程,2005(07):147-150.
张胜楠. 基于文本相似度的短文本主观题自动评分方法研究[D].武汉理工大学,2017.
何恒飞. 主观题智能阅卷的关键技术研究[D].北京工业大学,2013. _
杨靖云. 高考历史简答题自动评价方法研究[D].哈尔滨工业大学,2016.
赵丹. 主观题自动评分系统的研究与实现[D].西安电子科技大学,2019.
曹建奇. 基于自然语言处理的主观题自动评分系统的研究与实现[D].北京工业 大学,2015.
张胜楠. 基于文本相似度的短文本主观题自动评分方法研究[D].武汉理工大学,2017.
丁振国,陈海霞.一种基于知网的主观题阅卷算法[J].微电子学与计算机,2008(05):108-109+113.
张添一. 基于文本相似度计算的主观题自动阅卷技术研究[D].东北师范大学,2011.
何恒飞. 主观题智能阅卷的关键技术研究[D].北京工业大学,2013.
柏雪. 主观题自动阅卷系统的研究与设计[D].西南交通大学,2013.
孙润志. 基于语义理解的文本相似度计算研究与实现[D].中国科学院研究生院(沈阳计算技术研究所),2015.
金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005(02):291-297.
杨靖云. 高考历史简答题自动评价方法研究[D].哈尔滨工业大学,2016.
赵丹. 主观题自动评分系统的研究与实现[D].西安电子科技大学,2019.
蔡玮,黄陈蓉,林忠,韩磊.一种基于向量空间模型的主观题批改算法[J].计算机与现代化,2008(12):88-90.
韩磊,黄陈蓉,林忠,蔡玮.简答题在线自动批改系统的研究[J].南京工程学院学报(自然科学版),2008,6(03):34-38.
曹建奇提出使用工具(如LTP或standfordnlp等)获取句子的句法结构信息,包括主谓宾定状补、主谓关系、动宾关系、定中关系、状中关系,动补关系,将五种关系在句子中出现的次数构建向量,然后使用夹角余弦值计算句子关系之间的相似度。
曹建奇. 基于自然语言处理的主观题自动评分系统的研究与实现[D].北京工业大学,2015.
提取句子主干部分(核心谓语/与核心谓语有直接依存关系的动名词),然后根据依存关系进行相似度计算。
赵丹. 主观题自动评分系统的研究与实现[D].西安电子科技大学,2019.
主要是根据学生答案对应的节点与标准答案对应节点之间的关系来计算两者之间的匹配度
张添一. 基于文本相似度计算的主观题自动阅卷技术研究[D].东北师范大学,2011.
何屹松,孙媛媛,汪张龙,竺博.人工智能评测技术在大规模中英文作文阅卷中的应用探索[J].中国考试,2018(06):63-71.
周明,贾艳明,周彩兰,徐宁.基于篇章结构的英文作文自动评分方法[J].计算机 科学,2019,46(03):234-241.
王川. 基于自然语言处理的作文自动评分系统研究[D].武汉理工大学,2015.
陈珊珊. 自动作文评分模型及方法研究[D].哈尔滨工业大学,2017.
刘建阳.英文作文自动评分算法研究及系统实现[D].北京大学,2014
彭丽莎. 中考语文作文评分建议系统的设计与实现[D].华中科技大学,2020.
陈志恒. 基于深度学习的中文作文智能评测系统的设计与实现[D].中国科学院大学(中国科学院沈阳计算技术研究所),2021.
王川. 基于自然语言处理的作文自动评分系统研究[D].武汉理工大学,2015.
陈珊珊. 自动作文评分模型及方法研究[D].哈尔滨工业大学,2017.
何屹松,孙媛媛,汪张龙,竺博.人工智能评测技术在大规模中英文作文阅卷中的应用探索[J].中国考试,2018(06):63-71.
梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化教学,2007(05):18-24.
陈珊珊. 自动作文评分模型及方法研究[D].哈尔滨工业大学,2017.
陈珊珊. 自动作文评分模型及方法研究[D].哈尔滨工业大学,2017.
陈珊珊. 自动作文评分模型及方法研究[D].哈尔滨工业大学,2017.
彭丽莎. 中考语文作文评分建议系统的设计与实现[D].华中科技大学,2020.
何屹松,孙媛媛,汪张龙,竺博.人工智能评测技术在大规模中英文作文阅卷中的应用探索[J].中国考试,2018(06):63-71.
周明,贾艳明,周彩兰,徐宁.基于篇章结构的英文作文自动评分方法[J].计算机科学,2019,46(03):234-241.
陈珊珊. 自动作文评分模型及方法研究[D].哈尔滨工业大学,2017.
由于大部分论文都在使用传统方法,所以深度方法我还没有完全梳理处理,而且自己本身也在学习过程中,所以之后会继续加强深度学习与自动评分结合在一起的学习。
主要是使用抽取特征+尝试分类和回归做的自动评分 根据评分标准抽取主要特征,使用斯皮尔曼系数计算相关性,删掉相关性小的一些特征后进行数据归一化,分别尝试线性回归、岭回归、随机森林、xgoost、gbdt等,结果最好的是xgboost,准确率73%,猜测特征数过少,而且在计算斯皮尔曼系数时,没有特征与标签的相关性达到60%+,所以特征代表度不够;
主要完成了数据集抽取、分类、分析,PPOCR的数据label生成等工作,代码已经放在服务器端了;
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。