# 科技趋势分析系统 **Repository Path**: deepcy/trend-analysis-system ## Basic Information - **Project Name**: 科技趋势分析系统 - **Description**: BBC (Big Bang of Computing) 是一个科技趋势分析系统,通过分析arXiv论文数据,结合LLM增强分析,提供科技趋势的可视化和洞察 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-05-26 - **Last Updated**: 2025-10-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 科技趋势分析系统 (BBC) BBC (Big Bang of Computing) 是一个科技趋势分析系统,通过分析arXiv论文数据,结合LLM增强分析,提供科技趋势的可视化和洞察。 ## 功能特性 - 📊 arXiv论文数据自动获取与分析 - 🤖 LLM增强的论文摘要与趋势分析 - 📈 多维度的趋势可视化 - 📝 自动生成分析报告(PDF) - 🚀 REST API服务 ## 系统架构 ```mermaid graph TD A[arXiv Client] --> B[Trend Analyzer] B --> C[Vector Store] C --> D[LLM Analyzer] D --> E[Report Generator] A --> F[API Service] B --> F D --> F E --> F ``` ## 模块说明 ### 核心模块 1. **arxiv_client.py** - arXiv API客户端 - 支持关键词搜索 - 支持分类过滤 - 数据缓存机制 2. **trend_analyzer.py** - 趋势分析引擎 - 关键词频率统计 - 作者/机构分析 - 时间序列分析 3. **llm_analyzer.py** - LLM增强分析 - 论文摘要生成 - 趋势解释 - 洞察提取 4. **vector_store.py** - 向量存储 - 论文嵌入存储 - 语义搜索 - 相似度分析 ### 服务模块 1. **api_service.py** - FastAPI接口 - /papers - 获取论文数据 - /trends - 获取趋势分析 - /reports - 生成PDF报告 2. **main.py** - 主程序入口 - 命令行接口 - 批处理模式 ### 辅助模块 1. **config.py** - 配置管理 - 环境变量加载 - 默认参数设置 2. **report_generator.py** - 报告生成 - PDF格式输出 - 可视化图表嵌入 - 自定义模板 ## 开发指南 ### 环境设置 1. 安装依赖: ```bash pip install -r requirements.txt ``` 2. 配置环境变量: ```bash cp .env.example .env # 编辑.env文件设置你的API密钥等 ``` ### 运行测试 ```bash pytest --cov=src tests/ ``` 当前测试覆盖率: - api_service.py: 85% - arxiv_client.py: 78% - trend_analyzer.py: 82% - config.py: 95% - main.py: 70% 需要增加对llm_analyzer.py和vector_store.py的测试 ## 部署指南 ### Docker部署 1. 构建镜像: ```bash docker build -t bbc . ``` 2. 运行容器: ```bash docker-compose up -d ``` ### 生产环境建议 - 使用Redis缓存arXiv API响应 - 配置LLM服务的速率限制 - 启用API认证 ## 改进计划 1. **测试增强** - 增加LLM分析模块测试 - 添加向量存储测试 - 提高集成测试覆盖率 2. **性能优化** - 实现异步IO - 添加缓存层 - 优化向量索引 3. **功能扩展** - 支持更多数据源(PubMed, IEEE Xplore) - 添加订阅和提醒功能 - 开发Web前端 ## 贡献指南 欢迎提交Pull Request。请确保: 1. 添加适当的测试 2. 更新文档 3. 遵循代码风格(black + flake8) 本程序为测试版,全开源,随便用,报错请提交问题。 和我聊天微:cy321one 反馈邮箱:[samhoclub@163.com](mailto:samhoclub@163.com) 公众号:尘渊文化 ![img](https://pic1.zhimg.com/80/v2-77aed7e43dc44ddd627ef4ac285b8296_720w.png)