# 实现基于关键点匹配的智能体应用 **Repository Path**: lc061003/2222 ## Basic Information - **Project Name**: 实现基于关键点匹配的智能体应用 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-25 - **Last Updated**: 2026-04-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # LLM 工具调用 × 传统视觉算法 - Agent Tool Calling ## 项目简介 本项目是一个基于大语言模型(LLM)Function Calling 机制的视觉分析 Agent 系统。通过封装传统计算机视觉算法(ORB/SIFT 特征匹配)为可调用的工具,让 Agent 能够自动选择工具、获取结果、给出判断。项目展示了传统视觉算法并非"过时的",而是现代 AI 系统中可被调用的能力模块。 ## 功能特性 - **真实 Agent 循环**:基于 LLM Function Calling 的自主工具调用循环,而非预设工作流 - **多种视觉工具**: - `detect_keypoints` - 检测图像关键点(SIFT/ORB) - `match_images` - 特征匹配两张图像 - `compare_multiple` - 批量图像对比 - `list_images` - 列出可用图像 - **轨迹记录与回放**:完整记录 Agent 运行过程,支持查看和导出 - **技能导出**:将 Agent 运行轨迹保存为可复用的 Skill - **多模型支持**: - 在线 API:MiniMax、OpenAI、DeepSeek、硅基流动、阿里云百炼、智谱清言、月之暗面 - 离线模式:Ollama(支持 Qwen2.5、Llama 3.1、Mistral 等) - **Web 界面**:直观的对话界面,支持图像上传、拖拽、选中 ## 项目结构 ``` 数字图像处理/ ├── app.py # Flask 后端主程序 ├── agent/ │ └── vision_agent.py # Agent 核心逻辑 ├── tools/ │ ├── image_tools.py # 图像处理工具(SIFT/ORB) │ ├── llm_client.py # LLM 客户端(在线/离线) │ └── trajectory.py # 轨迹记录与技能导出 ├── static/ │ └── index.html # 前端页面 ├── images/ # 图像库目录 ├── trajectories/ # 轨迹存储目录 ├── skills/ # 技能存储目录 ├── requirements.txt # 依赖列表 └── README.md # 项目说明 ``` ## 安装与运行 ### 环境要求 - Python 3.8+ - Node.js(可选,用于前端开发) ### 安装依赖 ```bash pip install -r requirements.txt ``` ### 配置 编辑 `.env` 文件,设置 API 密钥: ``` MINIMAX_API_KEY=your_api_key_here ``` ### 运行 ```bash python app.py ``` 访问 http://localhost:5000 使用系统。 ## 使用说明 1. **上传图像**:点击或拖拽图像到左侧图像库 2. **对话**:在输入框中描述你的需求,如"比较这两张图的相似度" 3. **查看轨迹**:点击"轨迹"按钮查看 Agent 运行过程 4. **导出技能**:在轨迹窗口中点击"导出为 Skill"保存工作流 5. **切换模型**:在"AI 设置"中选择不同的模型服务商 ## 技术栈 - **后端**:Flask, OpenAI SDK, Ollama - **视觉算法**:OpenCV (SIFT, ORB, 特征匹配) - **前端**:HTML5, CSS3, JavaScript (原生) - **LLM 集成**:支持多种在线 API 和离线 Ollama ## 学生信息 | 项目 | 内容 | |------|------| | 班级 | 二班 | 学号 | 202452320208 | 姓名 | 李昶 | 专业 | 智能科学与技术 ## 许可证 本项目仅供学习使用。