# browser-use-demo **Repository Path**: zeus-maker/browser-use-demo ## Basic Information - **Project Name**: browser-use-demo - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-04-06 - **Last Updated**: 2025-08-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 网页文章结构分析工具 这是一个基于Python的网页文章分析工具,能够自动提取网页文章内容并生成结构化的Markdown格式大纲。该工具使用先进的AI技术来理解文章结构,并提供清晰的层次化输出。 ## 功能特性 - 🌐 支持任意网页URL的文章内容提取 - 📝 自动生成Markdown格式的文章结构 - 🤖 使用AI技术智能识别文章主要内容 - 🎯 准确提取标题、章节和重点内容 - 🧹 自动清理广告、评论等无关内容 - 💾 结果自动保存为Markdown文件 - 🌍 支持中英文等多语言内容 - 📊 提供Web界面进行交互操作 ## 安装步骤 1. 克隆项目代码: ```bash git clone [项目地址] cd [项目目录] ``` 2. 安装依赖: ```bash pip install -r requirements.txt ``` 3. 配置环境变量: 创建 `.env` 文件并添加以下配置: ``` DEEPSEEK_API_KEY=你的API密钥 PORT=5100 # 可选,默认为5100 ``` ## 使用方法 1. 启动服务: ```bash python app.py ``` 2. 访问Web界面: 打开浏览器访问 `http://localhost:5100` 3. 输入要分析的文章URL,点击"分析"按钮 4. 等待分析完成,结果将自动保存为 `article_structure.md` 文件 ## API接口说明 ### 生成文章结构 - 接口:`POST /api/generate-mindmap` - 请求格式: ```json { "url": "要分析的文章URL" } ``` - 响应格式: ```json { "success": true, "mindmap": "生成的Markdown内容" } ``` - 错误响应: ```json { "success": false, "error": "错误信息" } ``` ## 注意事项 1. 确保已正确配置DEEPSEEK_API_KEY环境变量 2. 网页分析可能需要一定时间,请耐心等待 3. 部分网站可能有反爬虫措施,可能影响内容提取 4. 建议使用Chrome或Firefox浏览器访问Web界面 ## 技术栈 - Python 3.8+ - Flask (Web框架) - Playwright (浏览器自动化) - DeepSeek API (AI内容分析) - HTML/CSS/JavaScript (前端界面) ## 常见问题 1. Q: 为什么某些网页无法提取内容? A: 可能是因为网站有反爬虫措施或内容加载方式特殊,建议检查网页是否可正常访问。 2. Q: 生成的内容格式不正确怎么办? A: 可以尝试刷新页面重新提取,或检查原文章格式是否规范。 3. Q: 如何自定义输出格式? A: 目前支持Markdown格式输出,后续会添加更多自定义选项。 ## 更新日志 ### v1.0.0 - 实现基础的文章内容提取功能 - 添加Web界面支持 - 支持Markdown格式输出 - 优化中文内容处理 - 改进编码处理逻辑 ## 贡献指南 欢迎提交Issue和Pull Request来帮助改进项目。在提交代码前,请确保: 1. 代码风格符合项目规范 2. 添加必要的注释和文档 3. 测试通过且不影响现有功能 ## 许可证 MIT License