# Clawome **Repository Path**: dbgo/Clawome ## Basic Information - **Project Name**: Clawome - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-02-27 - **Last Updated**: 2026-02-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
中文 | English
一次 API 调用,搞定任何网页任务。
给你的 AI 智能体一个自然语言目标 — Clawome 自动规划、浏览并返回结构化结果。
任务智能体 API • 快速开始 • DOM 压缩 • 性能基准 • 路线图
--- ## 任务智能体 API 一个 POST 请求,Clawome 处理剩下的一切 — 规划子任务、控制浏览器、读取页面并返回结果。 ```bash curl -X POST http://localhost:5001/api/agent/start \ -H "Content-Type: application/json" \ -d '{"description": "查找纽约大学 Tandon 工程学院的 AI 相关研究生项目"}' ``` 轮询进度: ```bash curl http://localhost:5001/api/agent/status ``` ```json { "status": "completed", "final_result": "NYU Tandon 提供以下 AI 相关项目:...", "subtasks": [ {"step": 1, "goal": "访问 NYU Tandon 网站", "status": "completed"}, {"step": 2, "goal": "提取项目列表", "status": "completed"} ], "llm_usage": {"calls": 12, "input_tokens": 25000, "total_tokens": 28000} } ``` 需要时可取消: ```bash curl -X POST http://localhost:5001/api/agent/stop ``` | 方法 | 端点 | 说明 | |------|------|------| | POST | `/api/agent/start` | 提交任务(自然语言) | | GET | `/api/agent/status` | 轮询进度、子任务和结果 | | POST | `/api/agent/stop` | 取消正在运行的任务 | **启动参数:** | 字段 | 类型 | 说明 | |------|------|------| | `task` | string | 任务描述(必填) | | `max_steps` | number | 覆盖此任务的步数上限(默认:15) | **状态值:** `idle` → `starting` → `running` → `completed` / `failed` / `cancelled` ### 任务编写技巧 ``` 差: "打开深圳大学网站看看有什么内容" 好: "打开 https://www.szu.edu.cn 首页,提取导航栏、最新3条新闻和通知公告" ``` - **给出 URL** — 避免让智能体猜测要去哪里 - **指定提取内容** — "最新5条新闻" 比 "所有新闻" 更好 - **复杂任务?增加步数** — `"max_steps": 30` 适用于多页面任务 - **或者拆分为小任务** — 每个任务聚焦一个页面或一个目标 ### 工作原理 ``` 你的 API 调用 → 任务智能体 → 规划子任务 → 执行浏览器操作 → 返回结果 ↑ | └── 评估并按需重新规划 ─────────────┘ ``` 智能体内部使用 LangGraph 状态机:感知页面 → 规划下一步 → 执行操作 → 感知结果 → 循环直到完成。 ### 特性 - **自然语言任务** — 用自然语言描述你想要的 - **多步规划** — 自动将复杂任务分解为子任务 - **智能执行** — 感知 → 规划 → 行动 → 感知循环,支持重试和异常检测 - **Markdown 结果** — 最终结果以 Markdown 格式输出,包含结构化数据 - **12+ LLM 供应商** — OpenAI、Anthropic、Google、DeepSeek、通义千问、Moonshot、智谱、Mistral、Groq、xAI 等 - **安全约束** — 仅限浏览器操作,硬性步数限制 --- ## DOM 压缩 在底层,任务智能体通过 Clawome 的 DOM 压缩器来感知网页 — 将 30 万 token 的原始 HTML 压缩到约 3000 token 的简洁结构化树。 **你也可以直接使用它**,作为独立 API 为你自己的智能体服务: ```bash # 打开页面 curl -X POST http://localhost:5001/api/browser/open \ -d '{"url": "https://www.google.com"}' # 读取压缩后的 DOM curl http://localhost:5001/api/browser/dom ``` ``` [1] form(role="search") [1.1] textarea(name="q", placeholder="Search") [1.2] button: Google Search [1.3] button: I'm Feeling Lucky [2] a(href): About [3] a(href): Gmail ``` - **100:1 压缩比** — 适用于典型网页 - 保留可见文本、交互元素和语义结构 - 层级节点 ID(如 `1.2.3`)用于精确元素定位 - 针对 Google、Wikipedia、Stack Overflow、YouTube 等网站的专用优化器 - Lite 模式可进一步节省 token ### 控制面板 - **浏览器实验场** — 交互式 DOM 查看器和浏览器控制 - **智能体界面** — 任务输入、实时进度追踪、可折叠的步骤详情 - **设置** — LLM 供应商配置、浏览器选项、压缩设置 - **API 文档** — 内置文档,支持中英双语 ## 快速开始 **前置条件:** Python 3.10+ ### pip 安装(推荐) ```bash pip install clawome # 从 PyPI 安装 clawome start # 引导配置 + 启动服务 ``` 如果 `clawome` 命令找不到,可以用: ```bash python -m clawome start # 备选启动方式 ``` `clawome start` 会: 1. 引导你选择 LLM 供应商、输入 API Key、选择模型 2. 自动安装 Playwright Chromium 浏览器 3. 启动后端服务和控制面板 ``` 服务 & 控制面板:http://localhost:5001 ``` 然后打开另一个终端运行任务: ```bash clawome "去Hacker News找最新AI新闻" # 提交任务并自动轮询 clawome status # 查看进度 clawome stop # 取消任务 clawome "复杂任务" --max-steps 30 # 指定步数上限 clawome setup # 重新配置 LLM ``` > 配置保存在 `~/.clawome/.env`。也可以通过控制面板 > 设置 来配置。 ### 从源码安装