马宝森

@ma_baosen

马宝森 暂无简介

所有 个人的 我参与的
Forks 暂停/关闭的

    马宝森/机器学习算法总结

    机器学习算法总结+代码实现

    马宝森/司法裁判大数据信息抽取

    以原始的裁判文书为输入,利用正则表达式、CRF 等构造文本解析模型,从被告人信息、犯罪事实信息、判决结果信息三个维度抽取出 40+相关字段并结构化到数据库中

    马宝森/类案案例推荐

    给定一篇裁判文书,在数据库中检索出若干篇与之相似度最高的裁判文书。

    马宝森/多标签分类的预测

    以一人多罪,数罪并罚的多罪名预测任务为导向,建立以 Seq2Seq+attention、 Transformer 等为基础的序列生成模型,同时借鉴机器翻译任务的预测机制, 使用生成模型进行多罪名预测并取得良好效果,完成在 RCV1-V2、AAPD、CAIL、CJO 等多标签数据集上的模型训练及使用。

    马宝森/使用区分信息的关系分类

    针对关系分类任务提出区分度信息的概念,通过实体向量相减的方法把空间中的实体方向信息转化为向量表示形式,并结合不同特征融合方法,完成在SemiEval 2010 Task8数据集上的模型训练及使用。 结果:负责模型搭建、训练、评估、使用。 对比MVRNN、FCM、SDP-LSTM、CR-CNN等传统关系分类模型,本模型的F1 值 84.8%。

搜索帮助