代码拉取完成,页面将自动刷新
Simple词典首先将输入标记转换为小写字母,然后检查停用词表。如果识别为停用词则返回空数组,即表示该标记会被丢弃。否则,输入标记的小写形式作为规范化后的lexeme返回。此外,Simple词典可通过设置参数Accept为false(默认值true),将非停用词报告为未识别,传递给后继词典继续处理。
创建Simple词典。
postgres=# CREATE TEXT SEARCH DICTIONARY public.simple_dict (
TEMPLATE = pg_catalog.simple,
STOPWORDS = english
);
其中,停用词表文件全名为english.stop。关于创建simple词典的语法和更多参数,请参见CREATE TEXT SEARCH DICTIONARY。
使用Simple词典。
postgres=# SELECT ts_lexize('public.simple_dict','YeS');
ts_lexize
-----------
{yes}
(1 row)
postgres=# SELECT ts_lexize('public.simple_dict','The');
ts_lexize
-----------
{}
(1 row)
设置参数ACCEPT=false,使Simple词典返回NULL,而不是返回非停用词的小写形式。
postgres=# ALTER TEXT SEARCH DICTIONARY public.simple_dict ( Accept = false );
ALTER TEXT SEARCH DICTIONARY
postgres=# SELECT ts_lexize('public.simple_dict','YeS');
ts_lexize
-----------
(1 row)
postgres=# SELECT ts_lexize('public.simple_dict','The');
ts_lexize
-----------
{}
(1 row)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。