5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
468
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
Java
almost 9 years ago
8919053 indexea 1673024392
182
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
135
基于HanLP自然语言处理包的elasticsearch分词器
5008798 detachina 1659674630
79
快速中文分词分析word segmentation
Java
over 1 year ago
60
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
534 zhzhenqin 1652695725
54
Paoding分词器基于Lucene4.x
Java
almost 10 years ago
5187 lionsoul 1578914315
36
elasticsearch便捷版本,集成了一些常用的插件
22
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java
over 4 years ago
18
elasticsearch的ik分词器动态扩展词库
Java
over 9 years ago
16
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java
almost 8 years ago
438805 eavnfor 1578923885
15
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
Java
almost 4 years ago
12 mirrors 1578989292
14
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具
7122 ysc 1578914462
13
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java
over 6 years ago
971 zacker330 1578913918
9
Chinese analysis plugin which using IK analysis for Elasticsearch

Search