@jjk666
端木云海 暂无简介
北大搜索引擎TSE完整源代码(索引+爬虫),加入我个人阅读代码的详细注释。
ctbparser是一个用C++语言实现的开源的中文处理工具包(GBK编码),用于分词、词性标注、依存句法分析,采用的是中文宾州树库(Chinese Tree Bank, CTB)标准。