代码拉取完成,页面将自动刷新
1、在analysis基础上修改分词算法 2、重构文件结构,支持composer 3、优化分词步骤(粗分、切分、优化三步完全独立) 4、优化词性标注,新增更多类别的词性 5、新增基于TF-IDF的权重排序 6、支持类成员链式调用,即是 xx()->xx()->xx() 模式
use Analysis\Analysis; $pa = Analysis::Instance() ->setSource("PHPAnalysis 2.0 的出现真是让人们眼前一亮,中文分词从此也可以变成了一件很好玩的事情。") ->setDifferMax(false) //最大切分 ->setDifferFreq(true) //二元消歧 ->setUnitWord(true) //单字合并 ->setOriginSave(false) //保留合并 ->setDeep(true) //深度分词 ->setOptimize(true) //优化分词 ->start(); //开始分析 当前,也可以使用默认参数,上面代码就可以简化为: $pa = Analysis::Instance() ->SetSource("PHPAnalysis 2.0 的出现真是让人们眼前一亮,中文分词从此也可以变成了一件很好玩的事情。") ->start();
$pa->getSimple($isWord = false)
$pa->getDeep()
$pa->getResult($hasProperty = false)
/* * @param $sort tf:词频, rank:TF-IDF评分, count:次数 * @param $num 数量, 0 or null返回全部 */ $pa->getRanks($sort='rank', $num=0)
$pa->getNewWords()
$pa->makeDict($sourceFile, $dicHand='main')
$pa->exportDict($sourceFile='', $dicHand='main')
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。