代码拉取完成,页面将自动刷新
scseg中文分词,是基于mmseg的简单分词组件
pip install scseg
import scseg
来引用scseg.seg_text
方法scseg.seg_text
函数接受3个参数:text
参数为需要分词的字符ext_dict_words
为用户自定义的扩展字典use_combine
代表是否需要合并处理代码示例( 全功能分词 )
#encoding=utf-8
import genius
seg_list = scseg.seg_text(u'中国人民站起来了pinyin')
print '\n'.join(seg_list)
scseg.seg_keywords
为面向索引的切割方式text
参数为需要分词的字符代码示例( 全功能分词 )
#encoding=utf-8
import scseg
seg_list = scseg.seg_keywords(u'中国人民站起来了pinyin')
print '\n'.join(seg_list)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。