5187 lionsoul 1578914315
2.2K
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
Java
1年前
474
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
Java
接近10年前
8919053 indexea 1673024392
207
基于 NLP 技术 ( HanLP ) 实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
Java
4个月前
139
基于HanLP自然语言处理包的elasticsearch分词器
Java
2年前
5008798 detachina 1725315384
80
快速中文分词分析word segmentation
Java
2年多前
62
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。
Java
10个月前
61
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java
7年前
534 zhzhenqin 1652695725
55
Paoding分词器基于Lucene4.x
Java
接近11年前
5187 lionsoul 1578914315
36
elasticsearch便捷版本,集成了一些常用的插件
Java
5年前
1020595 jianggujin 1731898115
23
基于ik-analyzer分词器,在其基础上实现对不同版本的lucene兼容,ik-analyzer项目主页地址为:https://code.google.com/archive/p/ik-analyzer/
Java
over 5 years ago
17
elasticsearch的ik分词器动态扩展词库
Java
over 10 years ago
16
利用IK分词器,扩展了solr4.7.2,luence4.7.2,拼音分词,基于IK2012FF,JDK1.6,
Java
接近9年前
438805 eavnfor 1578923885
16
针对mmseg4j (1.10.0)的拓展,弥补了多处不足,分词,随心所欲
Java
接近5年前
7122 ysc 1578914462
13
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
Java
over 7 years ago
12 mirrors 1578989292
12
CoreNLP 是斯坦福提供的一组用Java编写的自然语言分析工具

Search

0d507c66 1850385 C8b1a773 1850385