代码拉取完成,页面将自动刷新
# pyltp
pyltp 是 语言技术平台(Language Technology Platform, LTP)的 Python 封装。
在使用 pyltp 之前,您需要简要了解 语言技术平台(LTP) 能否帮助您解决问题。
目前基于Pytorch的LTP4 已经发布,而PyLTP将会只有非常有限的维护,请大家移步使用[LTP 4](LTP 4)
Python 2.7, 3.x, and PyPy (PyPy2.7 >= 5.7)
下面是一个使用 pyltp 进行分词的例子
# -*- coding: utf-8 -*-
from pyltp import Segmentor
segmentor = Segmentor("/path/to/your/cws/model")
words = segmentor.segment("元芳你怎么看")
print("|".join(words))
segmentor.release()
除了分词之外,pyltp 还提供词性标注、命名实体识别、依存句法分析、语义角色标注等功能。
详细使用方法可以参考 example
第一步,安装 pyltp
使用 pip 安装
$ pip install pyltp
或从源代码安装
$ git clone https://github.com/HIT-SCIR/pyltp
$ cd pyltp
$ git submodule init
$ git submodule update
$ python setup.py install
第二步,下载模型文件
七牛云,当前模型版本 3.4.0
git submodule init
git submodule update
python setup.py bdist_wheel
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。