5187_lionsoul
Jcseg是基于mmseg算法的一个轻量级Java中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的搜索分词接口
10 days ago 7 issues
5187_lionsoul
Friso是使用C语言开发的一款高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。同时支持对UTF-8/GBK编码的切分。
over 2 years ago
436788_rockyzheng
中文处理工具包,可能不是最快的开源中文分词,但很可能是最准的开源中文分词
over 1 year ago 1 issue
Go 语言高效分词, 支持英文、中文、日文等 词典用双数组trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划。 支持普通和搜索引擎两种分词模式,支持用户词典、词性标注,可运行JSON RPC服务。
9 months ago
59466_lizhengxian
模仿锤子M1新出的BigBang功能,轻松分词,重新造句,基于讯飞分词SDK实现
3 years ago
7122_ysc
Java中文分词组件 - word分词。本站是word分词在Github的镜像站点,仅做备份使用。
1 year ago
VicWord 一个纯php的分词
almost 2 years ago
372841_lishilei0523
由本人维护并修改的盘古分词组件
almost 3 years ago 3 issues
7122_ysc
Java开源项目cws_evaluation:中文分词器分词效果评估。本站是cws_evaluation在Github的镜像站点,仅做备份使用。
over 2 years ago
971_apl330
Chinese analysis plugin which using IK analysis for Elasticsearch
None update
elasticsearch的ik分词器动态扩展词库
over 5 years ago
缅甸语分词工具。A Rule-based Syllable Segmentation of Myanmar Text
None update
7122_ysc
Superword is a Java open source project dedicated in the study of English words analysis and auxiliary reading。本站是superword在Github的镜像站点,仅做备份使用。
over 1 year ago

Help Search