# TuriX-CUA **Repository Path**: devai/TuriX-CUA ## Basic Information - **Project Name**: TuriX-CUA - **Description**: TuriX 是一款由人工智能驱动的数字助手,能让你在各种应用程序和系统中实现任务自动化,适用于 Windows、Linux 和 macOS 系统。它不同于传统 RPA 和基于 API 的操作方式,只要人能点到的地方 TuriX 也能点,实现真正的跨应用自动化。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: main - **Homepage**: https://www.cnblogs.com/xueweihan/p/19738565 - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-20 - **Last Updated**: 2026-03-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

TuriX 标志

TuriX · AI 驱动的数字牛马

描述你的任务给你的电脑,以启动你的数字牛马。

English | 中文

## 📞 联系方式与社区 加入我们的 Discord 社区获取支持、讨论与更新:

加入我们的 Discord

如果对我们的项目感兴趣,也欢迎加入我们的微信群: ![QRcode](https://raw.githubusercontent.com/Dennisyk348/QRcode/main/QRcode_0318.jpg) 如微信群无法加入,请直接添加官方小助理: ![turix_QRcode](https://raw.githubusercontent.com/Dennisyk348/QRcode/main/QRcode_turix.jpg) 或通过邮件联系我们:contact@turix.ai TuriX 让你的强大 AI 模型能在桌面上真正动手操作。 它内置 **最先进的计算机使用Agent**(在我们的内部电脑操作测试集中通过率 > 68%),同时保持 100% 开源,并对个人与科研用途免费。 想用你自己的模型?**在 `config.json` 中切换即可。** ## 目录 - [📞 联系方式与社区](#contact-community) - [🤖 OpenClaw 技能](#openclaw-skill) - [📰 最新动态](#latest-news) - [🖼️ 演示](#demos) - [✨ 关键特性](#key-features) - [📊 模型性能指标](#model-performance) - [🚀 快速开始(macOS 15+)](#quickstart-macos-15) - [1. 下载应用](#download-app) - [2. 创建 Python 3.12 环境](#create-python-env) - [3. 授予 macOS 权限](#grant-macos-permissions) - [3.1 mac辅助功能](#accessibility) - [3.2 Safari 自动化](#safari-automation) - [4. 配置并运行](#configure-run) - [4.4 Skills(可选)](#skills-optional) - [🤝 贡献指南](#contributing) - [🗺️ 开发规划](#roadmap) --- ## 🤖 OpenClaw 技能 通过 OpenClaw 使用 TuriX 的 ClawHub Skills: https://clawhub.ai/Tongyu-Yan/turix-cua 这让 OpenClaw 可以调用 TuriX,作为你的桌面操作 Agent。 本仓库还提供 OpenCLaw 的本地技能包(macOS),位于 `OpenCLaw_TuriX_skill/`(包含 `SKILL.md` 与 `scripts/run_turix.sh`)。 将其复制到你的 OpenClaw 本地技能目录(例如:`clawd/skills/local/turix-mac/`),并参考 `OpenCLaw_TuriX_skill/README.md` 完成安装与权限设置。 OpenClaw 的 Windows 本地技能包位于 `multi-agent-windows` 分支的 `OpenCLaw_TuriX_skill/`,包含 `SKILL.md`、`scripts/run_turix.ps1` 与 `agents/openai.yaml`。 该更新支持在当前 OpenClaw 会话中通过 `turix`(别名 `turix-win`)直接分发任务,并在 `run_turix.ps1` 中增加了预检查(强制分支 `multi-agent-windows`、conda/config 校验、`--dry-run` 支持)。 你也可以直接让 OpenClaw 先阅读 `OpenCLaw_TuriX_skill/README.md`,再按文档安装并配置 TuriX。 --- ## 📰 最新动态 **2026 年 3 月 16 日** - 🐧 **Linux 支持已上线**,位于 `multi-agent-linux` 分支。如果你要在 Linux(如 Ubuntu)上运行 TuriX,请先切换分支: ```bash git checkout multi-agent-linux ``` **2026 年 3 月 9 日** - 我们在 `mac_legacy` 分支新增了 **OpenClaw 的 macOS Flash/Fast 模式技能包**。如果你要使用这个更快、更轻量的模式,请先切换分支: ```bash git checkout mac_legacy ``` **2026 年 3 月 5 日** - 我们更新了 `multi-agent-windows` 分支上的 **OpenClaw Windows 本地技能包**。本次更新加入可直接调用的 `turix` 技能别名、无需 Turix 子会话的直接分发机制、`run_turix.ps1` 的分支安全预检查,以及新的代理接口文件 `OpenCLaw_TuriX_skill/agents/openai.yaml`。 **2026 年 1 月 30 日** - 🧩 我们在 ClawHub 发布了 **TuriX OpenClaw 技能**:https://clawhub.ai/Tongyu-Yan/turix-cua。你现在可以使用 OpenClaw 调用 TuriX 来完成桌面自动化任务。 **2026 年 1 月 27 日 — v0.3** - 🎉 TuriX v0.3 已在 main 分支发布!本次更新带来 DuckDuckGo 搜索、Ollama 支持、先进的可恢复内存压缩,以及 Skills(技能手册),让规划更智能、记忆更稳健、工作流更可复用。欢迎更多用户体验并分享反馈,我们会持续推进平台进化。 **2026 年 1 月 27 日** - 🎉 我们在 `multi-agent` 与 `multi-agent-windows` 分支发布了 **可恢复的内存压缩** 和 **Skills**。这两项功能带来更稳定的记忆管理与可复用的 Markdown 技能手册,用于规划与执行任务。 **2026 年 1 月 27 日** - 🎉 我们在 `main`(原 `multi-agent`)与 `multi-agent-windows` 分支发布了 **可恢复的内存压缩** 和 **Skills**。这两项功能带来更稳定的记忆管理与可复用的 Markdown 技能手册,用于规划与执行任务。 **2025 年 12 月 30 日** - 🎉Agent架构迎来重要更新。我们在 `main`(原 `multi-agent`)分支引入多模型架构,将单一模型的压力分散到多个模型上,以减轻注意力机制的负担。 **2025 年 10 月 16 日** - 🚀 自动化爱好者的重大消息!TuriX 现已全面支持前沿的 **Qwen3-VL** 视觉语言模型,赋能 **macOS** 与 **Windows** 的顺畅自动化。基于我们的内部基准,该集成在复杂 UI 交互上可将成功率提升多达 15%。无论你是在脚本化日常流程还是处理复杂项目,Qwen3-VL 的多模态推理都能带来前所未有的精度。 **2025 年 9 月 30 日** - 🎉 激动人心的更新!我们在 [TuriX API 平台](https://turixapi.io) 发布了最新 AI 模型,带来更强性能、更聪明的推理以及更顺滑的集成,帮助你实现更强大的桌面自动化。开发者和研究者,现在就去平台获取并升级你的工作流! 准备好体验了吗?更新你的 `config.json` 并开始自动化吧——祝你玩得开心!🎉 *欢迎关注我们的 [Discord](https://discord.gg/vkEYj4EV2n) 获取使用技巧、用户故事以及后续的 重磅发布。* --- ## 🖼️ 演示

MacOS 演示

预订机票、酒店和 Uber。

TuriX macOS 演示 - 预订

查询 iPhone 价格,创建 Pages 文档,并发送给联系人

TuriX macOS 演示 - 查询 iPhone 价格并共享文档

在老板通过 Discord 发送的 Numbers 文件中生成柱状图,插入到 PowerPoint 的正确位置,并回复老板。

TuriX macOS 演示 - Excel 图表到 PowerPoint

Windows 演示

在 YouTube 搜索视频内容并点赞

TuriX Windows 演示 - 视频搜索与点赞

与 Claude 的 MCP 演示

Claude 搜索 AI 新闻并通过 MCP 调用 TuriX,将研究结果写入 Pages 文档并发送给联系人

TuriX MCP 演示 - 新闻搜索与共享

--- ## ✨ 关键特性 | 能力 | 含义 | |------------|---------------| | **SOTA 默认模型** | 在 Mac 上的成功率和速度上超越此前的开源Agent(如 UI‑TARS) | | **无需应用专用 API** | 只要人能点,TuriX 就能点——WhatsApp、Excel、Outlook、内部工具… | | **可热插拔的「大脑」** | 无需改代码即可替换 VLM 策略(`config.json`) | | **MCP 就绪** | 可接入 *Claude for Desktop* 或 **任何** 支持 Model Context Protocol (MCP) 的Agent | | **Skills(Markdown 手册)** | Planner 仅根据名称/描述选择技能,Brain 使用完整技能内容来指导每一步 | --- ## 📊 模型性能 我们Agent在桌面自动化任务上达到了业界领先的表现:

TuriX 性能

更多细节请查看我们的 [报告](https://turix.ai/technical-report/)。 ## 🚀 快速开始(macOS 15+) > **我们从不收集数据**——安装、授权,尽情折腾。 > **0. Windows 用户**:请切换到 `multi-agent-windows` 分支获取 Windows 专属的安装与设置说明。 > > ```bash > git checkout multi-agent-windows > ``` > > 如果你要使用更新后的 OpenClaw Windows 本地技能包,请查看该分支中的 `OpenCLaw_TuriX_skill/README.md`。 > > **0. Linux 用户**:请切换到 `multi-agent-linux` 分支获取 Linux 专属的安装与设置说明。 > > ```bash > git checkout multi-agent-linux > ``` > > **0. Windows 旧版用户**:如需此前的 Windows 版本,请切换到 `windows_legacy` 分支。 > > **0. macOS 旧版用户**:如需此前的单模型 macOS 版本,请切换到 `mac_legacy` 分支。 ### 1. 下载应用 为了更方便使用,[下载应用](https://turix.ai/) 或按下面的手动步骤安装: ### 2. 创建 Python 3.12 环境 首先克隆仓库并运行: ```bash conda create -n turix_env python=3.12 conda activate turix_env # requires conda ≥ 22.9 pip install -r requirements.txt ``` ### 3. 授予 macOS 权限 #### 3.1 辅助功能 1. 打开 **系统设置 ▸ 隐私与安全性 ▸ 辅助功能** 2. 点击 **+**,然后添加 **Terminal** 和 **Visual Studio Code**(或你使用的任何 IDE) 3. 如果运行仍然失败,也请添加 **/usr/bin/python3** #### 3.2 Safari 自动化 1. **Safari ▸ 设置 ▸ 高级** → 启用 **显示针对 Web 开发者的功能** 2. 在新出现的 **开发** 菜单中启用 * **允许远程自动化** * **允许来自 Apple Events 的 JavaScript** ##### 触发权限对话框(每个 shell 运行一次) ``` # macOS 终端 osascript -e 'tell application "Safari" to do JavaScript "alert("Triggering accessibility request")" in document 1' # VS Code 集成终端(重复一次以授权 VS Code) osascript -e 'tell application "Safari" to do JavaScript "alert("Triggering accessibility request")" in document 1' ``` > **在每个弹窗中点击“允许”**,这样Agent才能驱动 Safari。 ### 4. 配置并运行 #### 4.1 编辑任务配置 > [!IMPORTANT] > **任务配置非常关键**:任务指令的质量直接影响成功率。清晰、具体的提示会带来更好的自动化效果。 在 `examples/config.json` 中编辑任务: ```json { "agent": { "task": "open system settings, switch to Dark Mode" } } ``` #### 4.2 编辑 API 配置 从我们的[官网](https://turix.ai/api-platform/)获取 API,现在可获 $20 额度。 登录网站,密钥在页面底部。 在这个 main(multi-agent)分支,你需要同时配置 brain、actor 和 memory 模型;目前该特性仅支持苹果电脑。如果开启规划(`agent.use_plan: true`),还需要配置 planner 模型。 我们强烈建议你将 turix-actor 模型作为 actor。brain 可以使用你喜欢的任意 VLM,我们的API平台也提供Gemini-3-flash和turix-brain作为brain,适合大多数任务。 在 `examples/config.json` 中编辑 API: ```json "brain_llm": { "provider": "turix", "model_name": "turix-brain", "api_key": "YOUR_API_KEY", "base_url": "https://turixapi.io/v1" }, "actor_llm": { "provider": "turix", "model_name": "turix-actor", "api_key": "YOUR_API_KEY", "base_url": "https://turixapi.io/v1" }, "memory_llm": { "provider": "turix", "model_name": "turix-brain", "api_key": "YOUR_API_KEY", "base_url": "https://turixapi.io/v1" }, "planner_llm": { "provider": "turix", "model_name": "turix-brain", "api_key": "YOUR_API_KEY", "base_url": "https://turixapi.io/v1" } ``` 如果要使用本地 Ollama,请将各个角色指向你的 Ollama 服务: ```json "brain_llm": { "provider": "ollama", "model_name": "llama3.2-vision", "base_url": "http://localhost:11434" }, "actor_llm": { "provider": "ollama", "model_name": "llama3.2-vision", "base_url": "http://localhost:11434" }, "memory_llm": { "provider": "ollama", "model_name": "llama3.2-vision", "base_url": "http://localhost:11434" }, "planner_llm": { "provider": "ollama", "model_name": "llama3.2-vision", "base_url": "http://localhost:11434" } ``` #### 4.3 配置自定义模型(可选) 如果你想使用 build_llm 函数中未定义的其他模型,需要先在代码中定义,再在配置中设置。 main.py: ``` if provider == "name_you_want": return ChatOpenAI( model="gpt-4.1-mini", api_key=api_key, temperature=0.3 ) ``` 请根据你的 LLM 在 ChatOpenAI、ChatGoogleGenerativeAI、ChatAnthropic 或 ChatOllama 之间切换,并修改对应的模型名称。 #### 4.4 Skills(可选) Skills 是放在单一文件夹中的 Markdown 手册(默认 `skills/`)。每个技能文件以 YAML frontmatter 开头,包含 `name` 和 `description`,后面是操作说明。Planner 只读取名称与描述来选择技能;Brain 会读取完整内容来指导每一步的目标生成。 Skills 选择需要开启规划功能(`agent.use_plan: true`)。 示例技能文件(`skills/github-web-actions.md`): ```md --- name: github-web-actions description: 用于在浏览器中操作 GitHub(搜索仓库、点 Star 等)。 --- # GitHub Web Actions - 打开 GitHub,使用站内搜索并进入仓库页面。 - 若需要登录,先向用户确认再继续。 - 在继续之前确认 Star 按钮状态。 ``` 在 `examples/config.json` 中启用: ```json { "agent": { "use_plan": true, "use_skills": true, "skills_dir": "skills", "skills_max_chars": 4000 } } ``` #### 4.5 启动Agent ```bash python examples/main.py ``` **享受免手操作的计算体验 🎉** #### 4.6 恢复已中断的任务 如果任务中断,想从上次位置继续,请在 `examples/config.json` 中设置固定的 `agent_id` 并开启 `resume`: ```json { "agent": { "resume": true, "agent_id": "my-task-001" } } ``` 注意: - 使用与你要恢复的运行相同的 `agent_id`。 - 恢复时请保持同一个 `task`。 - 只有在 `src/agent/temp_files//memory.jsonl` 已存在时才会生效。 - 想重新开始:将 `resume` 设为 `false`、更换 `agent_id`,或删除 `src/agent/temp_files/`。 ## 🤝 贡献指南 我们欢迎贡献!请阅读我们的 [Contributing Guide](CONTRIBUTING.MD) 了解如何开始。 快速链接: - [开发环境配置](CONTRIBUTING.MD#development-setup) - [代码风格指南](CONTRIBUTING.MD#code-style-guidelines) - [测试](CONTRIBUTING.MD#testing) - [Pull Request 流程](CONTRIBUTING.MD#pull-request-process) 如果你发现 bug 或有功能需求,请 [提交 issue](https://github.com/TurixAI/TuriX-CUA/issues)。 ## 🗺️ 路线图 | 季度 | 功能 | 描述 | |---------|---------|-------------| | **2025 Q3** | **✅ 终止与恢复** | 支持从已终止的任务恢复 | | **2025 Q3** | **✅ Windows 支持** | 跨平台兼容,把 TuriX 自动化带到 Windows 环境(现已可用) | | **2025 Q3** | **✅ 增强的 MCP 集成** | 更深度的 Model Context Protocol 支持,第三方Agent连接更顺畅(现已可用)| | **2025 Q4** | **✅ 下一代 AI 模型** | 大幅提升点击准确率和任务执行能力 | | **2026 Q2** | **✅ Windows 优化模型** | 面向微软平台的原生 Windows 模型架构,性能更优 | | **2025 Q4** | **✅ 支持 Gemini-3-pro 模型** | 可运行任意兼容的视觉语言模型 | | **2025 Q4** | **✅ 规划器** | 理解用户意图并制定分步计划以完成任务 | | **2025 Q4** | **✅ 多智能体架构** | 评估并指导每一步执行 | | **2025 Q4** | **✅ Duckduckgo 集成** | 加速信息收集,提升规划效果(现已并入 main) | | **2026 Q1** | **✅ Ollama 支持** | 支持 Ollama Qwen3vl 模型 | | **2026 Q1** | **✅ 可恢复的内存压缩** | 推进内存管理机制,稳定性能(上传了测试版,待验证稳定性) | | **2026 Q1** | **✅ Skills** | 让CUA的执行流程更标准化,稳定 | | **2026 Q1** | **✅ OpenClaw 技能** | 已在 ClawHub 发布(https://clawhub.ai/Tongyu-Yan/turix-cua),让 OpenClaw 调用 TuriX 作为眼睛和手执行电脑任务。 | | **2026 Q1** | **✅ OpenClaw Windows 技能升级** | 已完成 `multi-agent-windows` 本地技能包更新,支持 `turix`/`turix-win` 直接分发、分支校验与 `--dry-run`。 | | **2026 Q1** | **✅ Linux 支持** | Linux 支持已在 `multi-agent-linux` 分支上线(包含 Ubuntu 等发行版)。 | | **2026 Q2** | **浏览器自动化** | 支持类 Chrome 浏览器以提升可扩展性 | | **2026 Q2** | **长期记忆** | 学习用户偏好并跨会话保留任务历史 | | **2026 Q2** | **示范学习** | 通过展示你偏好的方法与流程来训练Agent模型 |