@Kernellz88679
Zhen 暂无简介
自然人洞察体系
JIUTIAN-TReB是中国移动自主构建的针对表格推理的测评体系,涵盖了高质量且全面的数据体系(涵盖6大能力、26个任务)、多样化的推理模式(TCoT-文本推理、PoT-代码推理、ICoT-文本与代码的混合推理)、客观的评价指标(自然语言相似性评价、基于裁判大模型的打分、基于规则匹配的准确率计算),支持用户自定义数据集和评价指标,具备较高可扩展性,为结构化数据大模型的分析评测提供了新的基准