# Debate2Query

**Repository Path**: liyan24/debate2-query

## Basic Information

- **Project Name**: Debate2Query
- **Description**: Debate2Query: Human-in-the-Loop Retrieval Query Synthesis via LLM Debate Dynamics
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-07-30
- **Last Updated**: 2025-07-30

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

1.	面向检索式生成的对抗式智能体博弈框架的设计与实现
本部分聚焦于构建动态优化的生成-验证双智能体博弈系统，突破传统静态模型的效率与适配性瓶颈，具体内容如下：
（1）	双智能体的角色定义与交互机制
生成智能体：基于大模型提示工程设计，融入本地检索样例、检索式生成规范检查规则、少量领域知识，输入为用户或者评估智能体用自然语言描述的需求，输出为结构化检索式。
评估智能体：构建基于语义和规则的验证模块，对生成式智能体生成的检索式在查全率、查准率、检索式可用性进行评估。其流程包括：解析生成式，提取语义特征；评估检索式的查全率、查准率及逻辑；生成多维评分及修改意见，并反馈至生成智能体。
基准与记忆：为保证评估智能体分数具有参照性，使用少量人类标注数据集作为基准评估分数；为保证评估智能体基于历史分数，在评估智能体部分设置记忆模块。
动态博弈过程：生成智能体以最大化检索式生成分数为目标迭代优化策略，验证智能体则对检索式生成质量进行评分并返回修改意见，形成“生成→验证→优化”的闭环对抗机制。其具体流程为：生成式智能体首先根据用户输入的需求生成检索式，评估智能体根据检索式生成内容、评价维度、子模块评分进行评价及提出意见，并将评分及意见交给生成式智能体。生成式智能体结合检索式及上一轮的意见重新进行生成优化，在评估智能体的评价分数达到指定要求，或者迭代指定轮次后结束博弈过程。
（2）	实验验证
以量子、新材料等领域前期经过专家构建检索式为基准，构建测试数据集，对比传统规则模板（PICO）与基线模型（Seq2Seq+Attention），验证博弈框架在复杂查询中的性能优势。
2.	人在回路机制的集成与协同优化
为解决智能体博弈中局部最优、领域知识脱节等问题，本部分引入人类专家反馈，构建人机协同的动态优化范式。
（1）专家介入机制设计。搭建Web端协同平台，支持专家对每一轮博弈节点（如低评分检索式、逻辑冲突）进行标注、修正及优先级调整。
（2）实验验证。在测试数据集上使用人类修正，验证人在回路机制介入后的效率提升。