# browser4
**Repository Path**: platonai_galaxyeye/browser4
## Basic Information
- **Project Name**: browser4
- **Description**: 💖 Browser4:为 AI 自动化打造的闪电般快速、协程安全 (coroutine-safe) 的浏览器引擎 💖
✨ 核心能力
👽 浏览器智能体 (Browser Agents) — 能在浏览器中进行推理、规划并执行操作的自主智能体。
🤖 浏览器自动化 — 面向工作流、导航和数据提取的高性能自动化。
⚡ 极致性能 — 完全协程安全;支持单机每天访问 100k+ 页面。
- **Primary Language**: Kotlin
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: https://browser4.top
- **GVP Project**: No
## Statistics
- **Stars**: 66
- **Forks**: 24
- **Created**: 2022-10-12
- **Last Updated**: 2025-11-28
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 🤖 Browser4
[](https://hub.docker.com/r/galaxyeye88/browser4)
[](https://github.com/platonai/browser4/blob/main/LICENSE)
[](https://spring.io/projects/spring-boot)
---
[English](README.md) | 简体中文 | [中国镜像](https://gitee.com/platonai_galaxyeye/Browser4)
> 本文件已与英文版 README 同步(同步日期:2025-11-25),如有差异请以英文版为准。
**目录**
- 🤖 Browser4
- 🌟 项目介绍
- ✨ 核心能力
- 🎥 演示视频
- 🚀 快速开始
- 💡 使用示例
- 浏览器智能体
- 工作流自动化
- LLM + X-SQL
- 高速并行处理
- 自动抽取
- 📦 模块概览
- 📜 文档
- 🔧 代理配置 - 解锁网站访问
- ✨ 功能特性
- 🤝 支持与社区
## 🌟 项目介绍
💖 **Browser4:为 AI 自动化打造的闪电般快速、协程安全 (coroutine-safe) 的浏览器引擎** 💖
### ✨ 核心能力
* 👽 **浏览器智能体 (Browser Agents)** — 能在浏览器中进行推理、规划并执行操作的自主智能体。
* 🤖 **浏览器自动化** — 面向工作流、导航和数据提取的高性能自动化。
* ⚡ **极致性能** — 完全协程安全;支持单机每天访问 100k+ 页面。
* 🧠 **网页理解** — 深度理解动态、脚本驱动与交互式网页。
* 📊 **数据提取 API** — 强大的接口,低成本获取结构化数据。
---
## 🎥 演示视频
🎬 YouTube:
[](https://www.youtube.com/watch?v=_BcryqWzVMI)
📺 哔哩哔哩:
[https://www.bilibili.com/video/BV1kM2rYrEFC](https://www.bilibili.com/video/BV1kM2rYrEFC)
---
## 🚀 快速开始
**前置要求**:Java 17+ 与 Maven 3.6+
1. **克隆仓库**
```shell
git clone https://github.com/platonai/browser4.git
cd browser4
```
2. **配置你的 LLM API 密钥**
编辑 [application.properties](application.properties) 并添加你的 API Key。
3. **构建项目(Linux/macOS)**
```shell
./mvnw -q -DskipTests
```
**Windows (cmd)**:
```shell
mvnw.cmd -q -DskipTests
```
4. **运行示例(Linux/macOS)**
```shell
./mvnw -pl pulsar-examples exec:java -D"exec.mainClass=ai.platon.pulsar.examples.agent.Browser4AgentKt"
```
**Windows (cmd)**:
```shell
mvnw.cmd -pl pulsar-examples exec:java -D"exec.mainClass=ai.platon.pulsar.examples.agent.Browser4AgentKt"
```
如有乱码问题(Windows):
```shell
./bin/run-examples.ps1
```
在 `pulsar-examples` 模块中探索并运行示例,直观了解 Browser4 的能力。
Docker 部署请参见我们的 [Docker Hub 仓库](https://hub.docker.com/r/galaxyeye88/browser4)。
---
## 💡 使用示例
### 浏览器智能体
能理解自然语言指令并执行复杂浏览器工作流的自主智能体。
```kotlin
val agent = AgenticContexts.getOrCreateAgent()
val task = """
1. go to amazon.com
2. search for pens to draw on whiteboards
3. compare the first 4 ones
4. write the result to a markdown file
"""
agent.run(task)
```
### 工作流自动化
低层级浏览器自动化与数据提取,提供细粒度控制。
**特性:**
- 直接且完整的 Chrome DevTools Protocol (CDP) 控制,协程安全
- 精确的元素交互(点击、滚动、输入)
- 基于 CSS 选择器 / XPath 的快速数据提取
```kotlin
val session = AgenticContexts.getOrCreateSession()
val agent = session.companionAgent
val driver = session.getOrCreateBoundDriver()
// 打开并解析页面
var page = session.open(url)
var document = session.parse(page)
var fields = session.extract(document, mapOf("title" to "#title"))
// 与页面交互
var result = agent.act("scroll to the comment section")
var content = driver.selectFirstTextOrNull("#comments")
// 复杂的智能体任务
var history = agent.run("Search for 'smart phone', read the first four products, and give me a comparison.")
// 捕获并基于当前状态提取
page = session.capture(driver)
document = session.parse(page)
fields = session.extract(document, mapOf("ratings" to "#ratings"))
```
### LLM + X-SQL
适用于高复杂度的数据抽取流水线,包含数十个实体与每个实体数百个字段。
**优势:**
- 相比传统方法,可多提取 10 倍实体与 100 倍字段
- 结合 LLM 智能与精确 CSS 选择器 / XPath
- 类 SQL 语法,上手友好
```kotlin
val context = AgenticContexts.create()
val sql = """
select
llm_extract(dom, 'product name, price, ratings') as llm_extracted_data,
dom_first_text(dom, '#productTitle') as title,
dom_first_text(dom, '#bylineInfo') as brand,
dom_first_text(dom, '#price tr td:matches(^Price) ~ td, #corePrice_desktop tr td:matches(^Price) ~ td') as price,
dom_first_text(dom, '#acrCustomerReviewText') as ratings,
str_first_float(dom_first_text(dom, '#reviewsMedley .AverageCustomerReviews span:contains(out of)'), 0.0) as score
from load_and_select('https://www.amazon.com/dp/B08PP5MSVB -i 1s -njr 3', 'body');
"""
val rs = context.executeQuery(sql)
println(ResultSetFormatter(rs, withHeader = true))
```
示例代码:
* [使用 X-SQL 从亚马逊商品页抓取 100+ 字段](https://github.com/platonai/exotic-amazon/tree/main/src/main/resources/sites/amazon/crawl/parse/sql/crawl)
* [抓取多类型亚马逊页面的 X-SQL 集合](https://github.com/platonai/exotic-amazon/tree/main/src/main/resources/sites/amazon/crawl/parse/sql/crawl)
### 高速并行处理
通过并行浏览器控制与智能资源优化,获得极致吞吐。
**性能:**
- 单机每天访问 100,000+ 页面
- 并发会话管理
- 阻断无关资源,加速页面加载
```kotlin
val args = "-refresh -dropContent -interactLevel fastest"
val blockingUrls = listOf("*.png", "*.jpg")
val links = LinkExtractors.fromResource("urls.txt")
.map { ListenableHyperlink(it, "", args = args) }
.onEach {
it.eventHandlers.browseEventHandlers.onWillNavigate.addLast { page, driver ->
driver.addBlockedURLs(blockingUrls)
}
}
session.submitAll(links)
```
🎬 YouTube:
[](https://www.youtube.com/watch?v=_BcryqWzVMI)
📺 哔哩哔哩:
[https://www.bilibili.com/video/BV1kM2rYrEFC](https://www.bilibili.com/video/BV1kM2rYrEFC)
---
### 自动抽取
基于自 / 无监督机器学习的自动化、大规模、高精度字段发现与抽取——无需 LLM API 调用、无 Token 成本、确定且快速。
**它能做什么:**
- 以高精度学习商品 / 详情页上所有可抽取字段(通常从几十到上百)。
**为何不只用 LLM?**
- 仅依赖 LLM 的抽取会带来时延、成本与 Token 限制。
- 基于 ML 的自动抽取本地可复现,且可扩展到 10 万+ 页 / 天。
- 仍可结合二者:用自动抽取提供结构化基线 + LLM 做语义增强。
**快捷命令(PulsarRPAPro):**
```bash
# Linux/macOS:下载并演示采集(附诊断输出)
curl -L -o PulsarRPAPro.jar https://github.com/platonai/PulsarRPAPro/releases/download/v3.0.0/PulsarRPAPro.jar
# Windows (PowerShell):
Invoke-WebRequest -Uri https://github.com/platonai/PulsarRPAPro/releases/download/v3.0.0/PulsarRPAPro.jar -OutFile PulsarRPAPro.jar
```
> 旧版 exotic-standalone*.jar 调用方式已弃用,示例已更新为最新发布包下载。
**集成状态:**
- 现已通过配套项目 [PulsarRPAPro](https://github.com/platonai/PulsarRPAPro) 提供。
- 计划提供 Browser4 原生 API;关注后续版本发布。
**关键优势:**
- 高精度:>95% 字段被发现;多数字段精度 >99%(指示性测试数据)。
- 抗选择器震荡与 HTML 噪声。
- 零外部依赖(无需 API Key),规模化成本更优。
- 可解释:生成的选择器与 SQL 透明可审计。
👽 利用机器学习智能体抽取数据:

(即将推出:更丰富的仓库内示例与直接 API 挂钩。)
---
## 📦 模块概览
| 模块 | 说明 |
|--------|-------------|
| `pulsar-core` | 核心引擎:会话、调度、DOM、浏览器控制 |
| `pulsar-rest` | Spring Boot REST 层与命令端点 |
| `pulsar-client` | 客户端 SDK / CLI 工具 |
| `browser4-spa` | 面向浏览器智能体的单页应用 |
| `browser4-agents` | 智能体与爬虫编排及产品打包 |
| `pulsar-tests` | 重型集成与场景测试 |
| `pulsar-tests-common` | 共享测试工具与夹具 |
---
## 📜 文档
* 🛠️ [配置指南](docs/config.md)
* 📚 [源码构建](docs/build.md)
* 🧠 [进阶指南](docs/advanced-guides.md)
---
## 🔧 代理配置 - 解锁网站访问