5187_lionsoul_1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的搜索分词接口
1 month ago 8 issues
7122_ysc_1578914462
Java中文分词组件 - word分词。本站是word分词在Github的镜像站点,仅做备份使用。
over 1 year ago
7122_ysc_1578914462
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
over 2 years ago
971_zacker330_1578913918
Chinese analysis plugin which using IK analysis for Elasticsearch
None update
elasticsearch的ik分词器动态扩展词库
over 5 years ago
145212_gitclebeg_1578919448
自然语言分词模块,为中文语料批量分词,会继承各种分词工具
over 4 years ago
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
5 months ago
7122_ysc_1578914462
Superword is a Java open source project dedicated in the study of English words analysis and auxiliary reading。本站是superword在Github的镜像站点,仅做备份使用。
over 1 year ago
813258_liuyuantao_1578933542
MMSeg4j最新版1.9.1不支持Lucene5.0。修改MMSeg4j的源码支持lucene5.x
over 2 years ago
12_mirrors_1578989292
mmseg4j core 使用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器。
12 hours ago

Help Search