5187 lionsoul 1578914315
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene、solr、elasticsearch、opensearch的搜索分词接口
470
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包
429
Jiagu深度学习自然语言处理工具 知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要
5187 lionsoul 1578914315
366
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现
C
5 months ago
273
结巴中文分词做最好的Python分词组件
Python
over 10 years ago
436788 rockyzheng 1578923827
241
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
5460443 baidu 1578992824
228
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能
8919053 indexea 1673024392
189
基于 NLP 技术实现的中文分词插件,准确度比常用的分词器高太多,同时提供 ElasticSearch 和 OpenSearch 插件。
138
基于HanLP自然语言处理包的elasticsearch分词器
Java
over 1 year ago
125
Go 语言高效分词, 支持英文、中文、日文等
Go
over 2 years ago
5008798 detachina 1659674630
79
快速中文分词分析word segmentation
Java
over 1 year ago
68
kcws 是一个基于深度学习的分词系统和语料项目。 Deep Learning Chinese Word Segment
Python
over 6 years ago
1646371 tyoui 1578956781
61
该项目已经更换,在码云上不在更新,请更换地址如下。
Python
almost 5 years ago
60
IK中文分词,兼容solr/lucene6.6.0,优化数字和英文搜索
Java
over 6 years ago
57
Surfing-Segment是一个先进的文本分词工具,专门增强ik-analyzer。包含多个自定义词典,动态识别型号、同义词功能、elasticsearch插件等功能。显著的增强了对专业术语及复杂型号的分词精确度。是电商平台优化体验的理想选择。

Search

F2647f8d 8189591 Bbdfb06e 8189591