# TuriX-CUA
**Repository Path**: devai/TuriX-CUA
## Basic Information
- **Project Name**: TuriX-CUA
- **Description**: TuriX 是一款由人工智能驱动的数字助手,能让你在各种应用程序和系统中实现任务自动化,适用于 Windows、Linux 和 macOS 系统。它不同于传统 RPA 和基于 API 的操作方式,只要人能点到的地方 TuriX 也能点,实现真正的跨应用自动化。
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: main
- **Homepage**: https://www.cnblogs.com/xueweihan/p/19738565
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-03-20
- **Last Updated**: 2026-03-20
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
TuriX · AI 驱动的数字牛马
描述你的任务给你的电脑,以启动你的数字牛马。
English | 中文
## 📞 联系方式与社区
加入我们的 Discord 社区获取支持、讨论与更新:
如果对我们的项目感兴趣,也欢迎加入我们的微信群:

如微信群无法加入,请直接添加官方小助理:

或通过邮件联系我们:contact@turix.ai
TuriX 让你的强大 AI 模型能在桌面上真正动手操作。
它内置 **最先进的计算机使用Agent**(在我们的内部电脑操作测试集中通过率 > 68%),同时保持 100% 开源,并对个人与科研用途免费。
想用你自己的模型?**在 `config.json` 中切换即可。**
## 目录
- [📞 联系方式与社区](#contact-community)
- [🤖 OpenClaw 技能](#openclaw-skill)
- [📰 最新动态](#latest-news)
- [🖼️ 演示](#demos)
- [✨ 关键特性](#key-features)
- [📊 模型性能指标](#model-performance)
- [🚀 快速开始(macOS 15+)](#quickstart-macos-15)
- [1. 下载应用](#download-app)
- [2. 创建 Python 3.12 环境](#create-python-env)
- [3. 授予 macOS 权限](#grant-macos-permissions)
- [3.1 mac辅助功能](#accessibility)
- [3.2 Safari 自动化](#safari-automation)
- [4. 配置并运行](#configure-run)
- [4.4 Skills(可选)](#skills-optional)
- [🤝 贡献指南](#contributing)
- [🗺️ 开发规划](#roadmap)
---
## 🤖 OpenClaw 技能
通过 OpenClaw 使用 TuriX 的 ClawHub Skills:
https://clawhub.ai/Tongyu-Yan/turix-cua
这让 OpenClaw 可以调用 TuriX,作为你的桌面操作 Agent。
本仓库还提供 OpenCLaw 的本地技能包(macOS),位于 `OpenCLaw_TuriX_skill/`(包含 `SKILL.md` 与 `scripts/run_turix.sh`)。
将其复制到你的 OpenClaw 本地技能目录(例如:`clawd/skills/local/turix-mac/`),并参考 `OpenCLaw_TuriX_skill/README.md` 完成安装与权限设置。
OpenClaw 的 Windows 本地技能包位于 `multi-agent-windows` 分支的 `OpenCLaw_TuriX_skill/`,包含 `SKILL.md`、`scripts/run_turix.ps1` 与 `agents/openai.yaml`。
该更新支持在当前 OpenClaw 会话中通过 `turix`(别名 `turix-win`)直接分发任务,并在 `run_turix.ps1` 中增加了预检查(强制分支 `multi-agent-windows`、conda/config 校验、`--dry-run` 支持)。
你也可以直接让 OpenClaw 先阅读 `OpenCLaw_TuriX_skill/README.md`,再按文档安装并配置 TuriX。
---
## 📰 最新动态
**2026 年 3 月 16 日** - 🐧 **Linux 支持已上线**,位于 `multi-agent-linux` 分支。如果你要在 Linux(如 Ubuntu)上运行 TuriX,请先切换分支:
```bash
git checkout multi-agent-linux
```
**2026 年 3 月 9 日** - 我们在 `mac_legacy` 分支新增了 **OpenClaw 的 macOS Flash/Fast 模式技能包**。如果你要使用这个更快、更轻量的模式,请先切换分支:
```bash
git checkout mac_legacy
```
**2026 年 3 月 5 日** - 我们更新了 `multi-agent-windows` 分支上的 **OpenClaw Windows 本地技能包**。本次更新加入可直接调用的 `turix` 技能别名、无需 Turix 子会话的直接分发机制、`run_turix.ps1` 的分支安全预检查,以及新的代理接口文件 `OpenCLaw_TuriX_skill/agents/openai.yaml`。
**2026 年 1 月 30 日** - 🧩 我们在 ClawHub 发布了 **TuriX OpenClaw 技能**:https://clawhub.ai/Tongyu-Yan/turix-cua。你现在可以使用 OpenClaw 调用 TuriX 来完成桌面自动化任务。
**2026 年 1 月 27 日 — v0.3** - 🎉 TuriX v0.3 已在 main 分支发布!本次更新带来 DuckDuckGo 搜索、Ollama 支持、先进的可恢复内存压缩,以及 Skills(技能手册),让规划更智能、记忆更稳健、工作流更可复用。欢迎更多用户体验并分享反馈,我们会持续推进平台进化。
**2026 年 1 月 27 日** - 🎉 我们在 `multi-agent` 与 `multi-agent-windows` 分支发布了 **可恢复的内存压缩** 和 **Skills**。这两项功能带来更稳定的记忆管理与可复用的 Markdown 技能手册,用于规划与执行任务。
**2026 年 1 月 27 日** - 🎉 我们在 `main`(原 `multi-agent`)与 `multi-agent-windows` 分支发布了 **可恢复的内存压缩** 和 **Skills**。这两项功能带来更稳定的记忆管理与可复用的 Markdown 技能手册,用于规划与执行任务。
**2025 年 12 月 30 日** - 🎉Agent架构迎来重要更新。我们在 `main`(原 `multi-agent`)分支引入多模型架构,将单一模型的压力分散到多个模型上,以减轻注意力机制的负担。
**2025 年 10 月 16 日** - 🚀 自动化爱好者的重大消息!TuriX 现已全面支持前沿的 **Qwen3-VL** 视觉语言模型,赋能 **macOS** 与 **Windows** 的顺畅自动化。基于我们的内部基准,该集成在复杂 UI 交互上可将成功率提升多达 15%。无论你是在脚本化日常流程还是处理复杂项目,Qwen3-VL 的多模态推理都能带来前所未有的精度。
**2025 年 9 月 30 日** - 🎉 激动人心的更新!我们在 [TuriX API 平台](https://turixapi.io) 发布了最新 AI 模型,带来更强性能、更聪明的推理以及更顺滑的集成,帮助你实现更强大的桌面自动化。开发者和研究者,现在就去平台获取并升级你的工作流!
准备好体验了吗?更新你的 `config.json` 并开始自动化吧——祝你玩得开心!🎉
*欢迎关注我们的 [Discord](https://discord.gg/vkEYj4EV2n) 获取使用技巧、用户故事以及后续的 重磅发布。*
---
## 🖼️ 演示
MacOS 演示
预订机票、酒店和 Uber。
查询 iPhone 价格,创建 Pages 文档,并发送给联系人
在老板通过 Discord 发送的 Numbers 文件中生成柱状图,插入到 PowerPoint 的正确位置,并回复老板。
Windows 演示
在 YouTube 搜索视频内容并点赞
与 Claude 的 MCP 演示
Claude 搜索 AI 新闻并通过 MCP 调用 TuriX,将研究结果写入 Pages 文档并发送给联系人
---
## ✨ 关键特性
| 能力 | 含义 |
|------------|---------------|
| **SOTA 默认模型** | 在 Mac 上的成功率和速度上超越此前的开源Agent(如 UI‑TARS) |
| **无需应用专用 API** | 只要人能点,TuriX 就能点——WhatsApp、Excel、Outlook、内部工具… |
| **可热插拔的「大脑」** | 无需改代码即可替换 VLM 策略(`config.json`) |
| **MCP 就绪** | 可接入 *Claude for Desktop* 或 **任何** 支持 Model Context Protocol (MCP) 的Agent |
| **Skills(Markdown 手册)** | Planner 仅根据名称/描述选择技能,Brain 使用完整技能内容来指导每一步 |
---
## 📊 模型性能
我们Agent在桌面自动化任务上达到了业界领先的表现:
更多细节请查看我们的 [报告](https://turix.ai/technical-report/)。
## 🚀 快速开始(macOS 15+)
> **我们从不收集数据**——安装、授权,尽情折腾。
> **0. Windows 用户**:请切换到 `multi-agent-windows` 分支获取 Windows 专属的安装与设置说明。
>
> ```bash
> git checkout multi-agent-windows
> ```
>
> 如果你要使用更新后的 OpenClaw Windows 本地技能包,请查看该分支中的 `OpenCLaw_TuriX_skill/README.md`。
>
> **0. Linux 用户**:请切换到 `multi-agent-linux` 分支获取 Linux 专属的安装与设置说明。
>
> ```bash
> git checkout multi-agent-linux
> ```
>
> **0. Windows 旧版用户**:如需此前的 Windows 版本,请切换到 `windows_legacy` 分支。
>
> **0. macOS 旧版用户**:如需此前的单模型 macOS 版本,请切换到 `mac_legacy` 分支。
### 1. 下载应用
为了更方便使用,[下载应用](https://turix.ai/)
或按下面的手动步骤安装:
### 2. 创建 Python 3.12 环境
首先克隆仓库并运行:
```bash
conda create -n turix_env python=3.12
conda activate turix_env # requires conda ≥ 22.9
pip install -r requirements.txt
```
### 3. 授予 macOS 权限
#### 3.1 辅助功能
1. 打开 **系统设置 ▸ 隐私与安全性 ▸ 辅助功能**
2. 点击 **+**,然后添加 **Terminal** 和 **Visual Studio Code**(或你使用的任何 IDE)
3. 如果运行仍然失败,也请添加 **/usr/bin/python3**
#### 3.2 Safari 自动化
1. **Safari ▸ 设置 ▸ 高级** → 启用 **显示针对 Web 开发者的功能**
2. 在新出现的 **开发** 菜单中启用
* **允许远程自动化**
* **允许来自 Apple Events 的 JavaScript**
##### 触发权限对话框(每个 shell 运行一次)
```
# macOS 终端
osascript -e 'tell application "Safari" to do JavaScript "alert("Triggering accessibility request")" in document 1'
# VS Code 集成终端(重复一次以授权 VS Code)
osascript -e 'tell application "Safari" to do JavaScript "alert("Triggering accessibility request")" in document 1'
```
> **在每个弹窗中点击“允许”**,这样Agent才能驱动 Safari。
### 4. 配置并运行
#### 4.1 编辑任务配置
> [!IMPORTANT]
> **任务配置非常关键**:任务指令的质量直接影响成功率。清晰、具体的提示会带来更好的自动化效果。
在 `examples/config.json` 中编辑任务:
```json
{
"agent": {
"task": "open system settings, switch to Dark Mode"
}
}
```
#### 4.2 编辑 API 配置
从我们的[官网](https://turix.ai/api-platform/)获取 API,现在可获 $20 额度。
登录网站,密钥在页面底部。
在这个 main(multi-agent)分支,你需要同时配置 brain、actor 和 memory 模型;目前该特性仅支持苹果电脑。如果开启规划(`agent.use_plan: true`),还需要配置 planner 模型。
我们强烈建议你将 turix-actor 模型作为 actor。brain 可以使用你喜欢的任意 VLM,我们的API平台也提供Gemini-3-flash和turix-brain作为brain,适合大多数任务。
在 `examples/config.json` 中编辑 API:
```json
"brain_llm": {
"provider": "turix",
"model_name": "turix-brain",
"api_key": "YOUR_API_KEY",
"base_url": "https://turixapi.io/v1"
},
"actor_llm": {
"provider": "turix",
"model_name": "turix-actor",
"api_key": "YOUR_API_KEY",
"base_url": "https://turixapi.io/v1"
},
"memory_llm": {
"provider": "turix",
"model_name": "turix-brain",
"api_key": "YOUR_API_KEY",
"base_url": "https://turixapi.io/v1"
},
"planner_llm": {
"provider": "turix",
"model_name": "turix-brain",
"api_key": "YOUR_API_KEY",
"base_url": "https://turixapi.io/v1"
}
```
如果要使用本地 Ollama,请将各个角色指向你的 Ollama 服务:
```json
"brain_llm": {
"provider": "ollama",
"model_name": "llama3.2-vision",
"base_url": "http://localhost:11434"
},
"actor_llm": {
"provider": "ollama",
"model_name": "llama3.2-vision",
"base_url": "http://localhost:11434"
},
"memory_llm": {
"provider": "ollama",
"model_name": "llama3.2-vision",
"base_url": "http://localhost:11434"
},
"planner_llm": {
"provider": "ollama",
"model_name": "llama3.2-vision",
"base_url": "http://localhost:11434"
}
```
#### 4.3 配置自定义模型(可选)
如果你想使用 build_llm 函数中未定义的其他模型,需要先在代码中定义,再在配置中设置。
main.py:
```
if provider == "name_you_want":
return ChatOpenAI(
model="gpt-4.1-mini", api_key=api_key, temperature=0.3
)
```
请根据你的 LLM 在 ChatOpenAI、ChatGoogleGenerativeAI、ChatAnthropic 或 ChatOllama 之间切换,并修改对应的模型名称。
#### 4.4 Skills(可选)
Skills 是放在单一文件夹中的 Markdown 手册(默认 `skills/`)。每个技能文件以 YAML frontmatter 开头,包含 `name` 和 `description`,后面是操作说明。Planner 只读取名称与描述来选择技能;Brain 会读取完整内容来指导每一步的目标生成。
Skills 选择需要开启规划功能(`agent.use_plan: true`)。
示例技能文件(`skills/github-web-actions.md`):
```md
---
name: github-web-actions
description: 用于在浏览器中操作 GitHub(搜索仓库、点 Star 等)。
---
# GitHub Web Actions
- 打开 GitHub,使用站内搜索并进入仓库页面。
- 若需要登录,先向用户确认再继续。
- 在继续之前确认 Star 按钮状态。
```
在 `examples/config.json` 中启用:
```json
{
"agent": {
"use_plan": true,
"use_skills": true,
"skills_dir": "skills",
"skills_max_chars": 4000
}
}
```
#### 4.5 启动Agent
```bash
python examples/main.py
```
**享受免手操作的计算体验 🎉**
#### 4.6 恢复已中断的任务
如果任务中断,想从上次位置继续,请在 `examples/config.json` 中设置固定的 `agent_id` 并开启 `resume`:
```json
{
"agent": {
"resume": true,
"agent_id": "my-task-001"
}
}
```
注意:
- 使用与你要恢复的运行相同的 `agent_id`。
- 恢复时请保持同一个 `task`。
- 只有在 `src/agent/temp_files//memory.jsonl` 已存在时才会生效。
- 想重新开始:将 `resume` 设为 `false`、更换 `agent_id`,或删除 `src/agent/temp_files/`。
## 🤝 贡献指南
我们欢迎贡献!请阅读我们的 [Contributing Guide](CONTRIBUTING.MD) 了解如何开始。
快速链接:
- [开发环境配置](CONTRIBUTING.MD#development-setup)
- [代码风格指南](CONTRIBUTING.MD#code-style-guidelines)
- [测试](CONTRIBUTING.MD#testing)
- [Pull Request 流程](CONTRIBUTING.MD#pull-request-process)
如果你发现 bug 或有功能需求,请 [提交 issue](https://github.com/TurixAI/TuriX-CUA/issues)。
## 🗺️ 路线图
| 季度 | 功能 | 描述 |
|---------|---------|-------------|
| **2025 Q3** | **✅ 终止与恢复** | 支持从已终止的任务恢复 |
| **2025 Q3** | **✅ Windows 支持** | 跨平台兼容,把 TuriX 自动化带到 Windows 环境(现已可用) |
| **2025 Q3** | **✅ 增强的 MCP 集成** | 更深度的 Model Context Protocol 支持,第三方Agent连接更顺畅(现已可用)|
| **2025 Q4** | **✅ 下一代 AI 模型** | 大幅提升点击准确率和任务执行能力 |
| **2026 Q2** | **✅ Windows 优化模型** | 面向微软平台的原生 Windows 模型架构,性能更优 |
| **2025 Q4** | **✅ 支持 Gemini-3-pro 模型** | 可运行任意兼容的视觉语言模型 |
| **2025 Q4** | **✅ 规划器** | 理解用户意图并制定分步计划以完成任务 |
| **2025 Q4** | **✅ 多智能体架构** | 评估并指导每一步执行 |
| **2025 Q4** | **✅ Duckduckgo 集成** | 加速信息收集,提升规划效果(现已并入 main) |
| **2026 Q1** | **✅ Ollama 支持** | 支持 Ollama Qwen3vl 模型 |
| **2026 Q1** | **✅ 可恢复的内存压缩** | 推进内存管理机制,稳定性能(上传了测试版,待验证稳定性) |
| **2026 Q1** | **✅ Skills** | 让CUA的执行流程更标准化,稳定 |
| **2026 Q1** | **✅ OpenClaw 技能** | 已在 ClawHub 发布(https://clawhub.ai/Tongyu-Yan/turix-cua),让 OpenClaw 调用 TuriX 作为眼睛和手执行电脑任务。 |
| **2026 Q1** | **✅ OpenClaw Windows 技能升级** | 已完成 `multi-agent-windows` 本地技能包更新,支持 `turix`/`turix-win` 直接分发、分支校验与 `--dry-run`。 |
| **2026 Q1** | **✅ Linux 支持** | Linux 支持已在 `multi-agent-linux` 分支上线(包含 Ubuntu 等发行版)。 |
| **2026 Q2** | **浏览器自动化** | 支持类 Chrome 浏览器以提升可扩展性 |
| **2026 Q2** | **长期记忆** | 学习用户偏好并跨会话保留任务历史 |
| **2026 Q2** | **示范学习** | 通过展示你偏好的方法与流程来训练Agent模型 |