# Debate2Query **Repository Path**: liyan24/debate2-query ## Basic Information - **Project Name**: Debate2Query - **Description**: Debate2Query: Human-in-the-Loop Retrieval Query Synthesis via LLM Debate Dynamics - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-07-30 - **Last Updated**: 2025-07-30 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 1. 面向检索式生成的对抗式智能体博弈框架的设计与实现 本部分聚焦于构建动态优化的生成-验证双智能体博弈系统,突破传统静态模型的效率与适配性瓶颈,具体内容如下: (1) 双智能体的角色定义与交互机制 生成智能体:基于大模型提示工程设计,融入本地检索样例、检索式生成规范检查规则、少量领域知识,输入为用户或者评估智能体用自然语言描述的需求,输出为结构化检索式。 评估智能体:构建基于语义和规则的验证模块,对生成式智能体生成的检索式在查全率、查准率、检索式可用性进行评估。其流程包括:解析生成式,提取语义特征;评估检索式的查全率、查准率及逻辑;生成多维评分及修改意见,并反馈至生成智能体。 基准与记忆:为保证评估智能体分数具有参照性,使用少量人类标注数据集作为基准评估分数;为保证评估智能体基于历史分数,在评估智能体部分设置记忆模块。 动态博弈过程:生成智能体以最大化检索式生成分数为目标迭代优化策略,验证智能体则对检索式生成质量进行评分并返回修改意见,形成“生成→验证→优化”的闭环对抗机制。其具体流程为:生成式智能体首先根据用户输入的需求生成检索式,评估智能体根据检索式生成内容、评价维度、子模块评分进行评价及提出意见,并将评分及意见交给生成式智能体。生成式智能体结合检索式及上一轮的意见重新进行生成优化,在评估智能体的评价分数达到指定要求,或者迭代指定轮次后结束博弈过程。 (2) 实验验证 以量子、新材料等领域前期经过专家构建检索式为基准,构建测试数据集,对比传统规则模板(PICO)与基线模型(Seq2Seq+Attention),验证博弈框架在复杂查询中的性能优势。 2. 人在回路机制的集成与协同优化 为解决智能体博弈中局部最优、领域知识脱节等问题,本部分引入人类专家反馈,构建人机协同的动态优化范式。 (1)专家介入机制设计。搭建Web端协同平台,支持专家对每一轮博弈节点(如低评分检索式、逻辑冲突)进行标注、修正及优先级调整。 (2)实验验证。在测试数据集上使用人类修正,验证人在回路机制介入后的效率提升。