代码拉取完成,页面将自动刷新
.. py:class:: mindspore.dataset.text.Lookup(vocab, unknown_token=None, data_type=mstype.int32) 根据词表,将分词标记(token)映射到其索引值(id)。 参数: - **vocab** (:class:`~.text.Vocab`) - 词表对象,用于存储分词和索引的映射。 - **unknown_token** (str, 可选) - 备用词汇,用于要查找的单词不在词汇表时进行替换。 如果单词不在词汇表中,则查找结果将替换为 `unknown_token` 的值。 如果单词不在词汇表中,且未指定 `unknown_token` ,将抛出运行时错误。默认值: ``None`` ,不指定该参数。 - **data_type** (mindspore.dtype, 可选) - Lookup输出的数据类型。默认值: ``mstype.int32`` 。 异常: - **TypeError** - 参数 `vocab` 类型不为 :class:`mindspore.dataset.text.Vocab` 。 - **TypeError** - 参数 `unknown_token` 类型不为str。 - **TypeError** - 参数 `data_type` 类型不为 :class:`mindspore.dtype` 。 教程样例: - `文本变换样例库 <https://www.mindspore.cn/docs/zh-CN/master/api_python/samples/dataset/text_gallery.html>`_
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。