# echo-parrot **Repository Path**: yeshizhe/echo-parrot ## Basic Information - **Project Name**: echo-parrot - **Description**: No description available - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2025-11-21 - **Last Updated**: 2025-11-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Echo-Parrot (回声鹦鹉) Echo-Parrot,中文名称是回声鹦鹉,是一个AI服务,通过LLM大语言模型与各种AI技术,基于公开信息自动构建行业知识库。 ## 项目简介 Echo-Parrot 是您专属的行业知识挖掘专家。只需设定目标领域,它就能24/7不间断地从互联网公开信息中自动采集、整理、分析,为您构建一个结构化、专业化的行业知识库。 告别繁琐的手动资料收集与整理,Echo-Parrot通过智能爬虫技术,自动从网页、博客、RSS源等渠道获取最新行业动态,并运用先进的AI技术对信息进行深度处理与知识提炼。您可以通过文字或语音与系统实时交互,随时调整构建方向,修正内容质量,确保知识库精准满足您的专业需求。 无论是市场研究、竞品分析还是行业趋势预测,Echo-Parrot都能为您提供全面、准确、实时的行业知识支持,助您在信息海洋中快速定位关键价值,赢得决策先机。 ## 第一阶段功能(已完成) ### 1. 功能特性 - 创建知识库 - 支持多文档批量上传 - 保存文档格式:txt / md / doc / docx / ppt / pptx / pdf - 保存为标准文本文件格式(经过read后未经切片) - 切片并且持久化入库 - 知识库文件列表查询 - 文件切片查询 - 相似性搜索 - 与xiaozhi-server-java集成 ### 2. 知识库存储说明 - 用户从提供的前端页面上传知识文档,原始文件保存到系统配置项指定的本地目录存储 - `${datasets.path:datasets}/uploads` 保存上传的原始文件 - `${datasets.path:datasets}/segments` 保存上传文件切片后的片段文本(目前以xml格式保存) - 第一阶段支持word / md / txt / pdf 等有限的文档格式(暂不支持图片、excel或工程图纸等) - embedding向量化后的数据直接保存到neo4j - 第一阶段使用常用的分段切片然后向量化方式(暂不做知识图谱三元组) ## 第二阶段功能计划 ### 1. 概述 基于公开信息自动构建行业知识库,提供一站式的市场分析、调研、选品,生成洞察报告。以"AI玩具"为例构建行业知识库,但EchoParrot适用于任何行业领域。 ### 2. MCP-Server实现 作为行业知识库的提供者,EchoParrot将实现完整的MCP-Server: - 提示词不直接提供MCP - 智能体及各种工具通过MCP对外提供服务 - 提供完整的HTTP+SSE的MCP-Server实现 - 知识库内容作为MCP的Resource提供 ### 3. 核心功能模块 #### 3.1 信息源管理 - 支持配置RSS源(如微信公众号文章)自动获取行业相关信息 - 当前阶段以配置文件方式进行管理,暂不提供可视化界面 #### 3.2 资料获取与清洗 - 构建全生命周期数据存储结构 - 自动处理爬取数据,去除重复、无效信息 - 对资料进行自动整合、分析和总结 - 建立产品、公司、产业链之间的关联关系 - 系统24小时不间断进行网络资料爬取与处理 #### 3.3 智能知识库 - 保留原始文档存储 - 对文档进行向量化处理,支持语义搜索 - 将原始资料加工整理为结构化知识 - 自动识别新资料并更新知识库,支持历史回溯 #### 3.4 问答智能体(支持语音IO) - 根据用户需求自动规划工具调用和信息获取 - 支持将分析结果导出为PDF、Markdown等格式 - 根据用户输入匹配最相关的市场信息和产品数据 - 基于用户反馈持续优化信息获取和分析策略 #### 3.5 AI玩具产品库(示例领域) - 收录市场上在售的AI玩具产品及其详细信息 - 按芯片、PCBA、电池、扬声器等分类管理 - 收录零部件技术参数并与具体产品关联 - 提供产品市场趋势、热销指数等分析 #### 3.6 AI玩具产业链 - 可视化展示AI玩具产业链上下游关系 #### 3.7 AI玩具公司库 - 收录产业链上下游公司信息 - 自动收集并验证公司联系方式 ### 4. 用户管理 - 使用JWT方案验证用户 - 基于RBAC进行权限管理 - 界面简洁直观,操作流程不超过3步 - 当前阶段仅提供PC端浏览器布局