代码拉取完成,页面将自动刷新
.. py:class:: mindformers.models.ChatGLM2ForConditionalGeneration(config: ChatGLM2Config, **kwargs)
在线计算并提供执行ChatGLM2训练时的损失值和逻辑值。
参数:
- **config** (ChatGLM2Config) - ChatGLM2模型的配置。
- **kwargs** (dict, 可选) - 一个可变数量的关键字参数,为待扩展的关键字参数预留。
输入:
- **input_ids** (Tensor, 可选) - 一个分词后的输入数据张量,它是32位整数类型,shape为: `(batch, seq_length)` 。默认值: ``None`` 。
- **labels** (Tensor, 可选) - 一个分词后的标签数据张量,它是32位整数类型,shape为: `(batch, seq_length)` 。默认值: ``None`` 。
- **input_position** (Tensor, 可选) - 当前位置,在推理使用。默认值: ``None`` 。
- **position_ids** (Tensor, 可选) - 保留参数,不使用。默认值: ``None`` 。
- **attention_mask** (Tensor, 可选) - 保留参数,不使用。默认值: ``None`` 。
- **input_embeds** (Tensor, 可选) - 保留参数,不使用。默认值: ``None`` 。
- **init_reset** (bool, 可选) - shape为[1]的bool张量,用于清除增量推理中之前的键参数和值参数。默认值: ``None`` 。
- **batch_valid_length** (Tensor, 可选) - 在增量推理中,用于上一步计算索引的张量。它是32位整数类型,shape为 `[batch_size]` 。默认值: ``None`` 。
- **prefix_key_values** (Tensor, 可选) - 在正常的键值对之前添加的一组额外的键值对。这些前缀键值对可以用来捕获长期依赖关系或提供先验知识,从而帮助模型更好地理解和生成序列。默认值: ``None`` 。
- **block_tables** (Tensor[int64], 可选) - 存储每个序列的映射表。默认值: ``None`` 。
- **slot_mapping** (Tensor[int32], 可选) - 存储序列缓存的物理槽索引。默认值: ``None`` 。
- **batch_index** (Tensor, 可选) - 保留参数,不使用。默认值: ``None`` 。
- **zactivate_len** (Tensor, 可选) - 保留参数,不使用。默认值: ``None`` 。
输出:
outputs(Tensor),包括在线损失值或者逻辑值、预测文本序列、输入掩码。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。