# EvoCUA **Repository Path**: shenxiaoming77/EvoCUA ## Basic Information - **Project Name**: EvoCUA - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-17 - **Last Updated**: 2026-03-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
**🥇 开源模型第一 | OSWorld 排行榜(2026年1月)**
---
## 🚀 快速开始
### 安装环境
推荐使用 Python 3.12。
```bash
git clone https://github.com/meituan/EvoCUA.git
cd EvoCUA
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
```
### 模型下载与部署
请先从 HuggingFace 下载 EvoCUA 模型权重,并使用 **vLLM** 将其部署为兼容 OpenAI 接口的推理服务。
推荐版本:
- torch: 2.8.0+cu126
- transformers: 4.57.3
- vllm: 0.11.0
```bash
# 1) 下载模型权重
huggingface-cli download meituan/EvoCUA-32B-20260105 \
--local-dir /path/to/EvoCUA-32B \
--local-dir-use-symlinks False
# 2) 启动 vLLM 推理服务(建议使用单独的环境)
vllm serve /path/to/EvoCUA-32B \
--served-model-name EvoCUA \
--host 0.0.0.0 \
--port 8080 \
--tensor-parallel-size 2
# 3) 设置环境变量
# 环境变量可通过 .env 文件进行配置(请参考 env.template):
cp env.template .env
# 编辑 .env 文件,填入您的具体配置,例如:
export OPENAI_API_KEY="dummy"
export OPENAI_BASE_URL="http://127.0.0.1:8080/v1"
```
### 在 OSWorld 上运行评测
```bash
python3 run_multienv_evocua.py \
--headless \
--provider_name aws \
--observation_type screenshot \
--model EvoCUA-S2 \
--result_dir ./evocua_results \
--test_all_meta_path evaluation_examples/test_nogdrive.json \
--max_steps 50 \
--num_envs 30 \
--temperature 0.01 \
--max_history_turns 4 \
--coordinate_type relative \
--resize_factor 32 \
--prompt_style S2
```
---
## 📁 项目结构
```
EvoCUA/
├── run_multienv_evocua.py # 评测入口(支持多环境并行)
├── lib_run_single.py # 单任务 Rollout 执行逻辑(含轨迹记录、截图、录屏、评分)
├── lib_results_logger.py # 评测结果实时汇总(写入 results.json)
├── desktop_env/ # OSWorld 环境端实现
│ ├── providers/ # 虚拟机提供商接口(AWS/VMware/Docker 等)
│ ├── controllers/ # 环境控制器
│ └── evaluators/ # 任务评估器
├── mm_agents/
│ └── evocua/ # EvoCUA Agent 核心代码(Prompt构建、输出解析、动作生成)
└── evaluation_examples/ # OSWorld 任务配置集
```
---
## 📖 关于 OSWorld
[OSWorld](https://os-world.github.io/) 是 Computer Use Agent 领域最具影响力的基准测试,被 **OpenAI、Anthropic、字节跳动 Seed、月之暗面、智谱 AI、阶跃星辰** 等众多顶尖 AI 团队广泛采用。OSWorld 通过模拟真实桌面环境中的多轮交互,全面评估 Agent 完成实际计算机任务的能力。
---
## 🔗 相关资源
- 🤗 **模型权重**:
- [meituan/EvoCUA-32B-20260105](https://huggingface.co/meituan/EvoCUA-32B-20260105) - OSWorld 得分:**56.7%** 🥇
- [meituan/EvoCUA-8B-20260105](https://huggingface.co/meituan/EvoCUA-8B-20260105) - OSWorld 得分:**46.06%** 🆕
- 📊 **OSWorld 基准测试**:[os-world.github.io](https://os-world.github.io/)
- 📄 **技术报告**:[tech_report.pdf](https://arxiv.org/abs/2601.15876)
- 🚀 **更多规格**:更多尺寸的模型正在路上!
---
## 🙏 致谢
我们诚挚感谢开源社区在 Computer Use Agent 领域的杰出贡献。特别感谢 **Xinyuan Wang**([OpenCUA](https://github.com/xlang-ai/OpenCUA))和 **Tianbao Xie**([OSWorld](https://github.com/xlang-ai/OSWorld))在评测、技术探讨及反馈方面提供的宝贵支持,他们的开创性工作极大地启发并推动了本项目的发展。我们致力于回馈社区,并将持续开源研究成果,与大家共同推动领域进步。
---
## 📝 引用
如果您觉得 EvoCUA 对您的研究有帮助,请考虑引用:
```bibtex
@article{xue2026evocua,
title={EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience},
author={Xue, Taofeng and Peng, Chong and Huang, Mianqiu and Guo, Linsen and Han, Tiancheng and Wang, Haozhe and Wang, Jianing and Zhang, Xiaocheng and Yang, Xin and Zhao, Dengchang and others},
journal={arXiv preprint arXiv:2601.15876},
year={2026}
}
```
---
## 📜 开源协议
本项目基于 Apache 2.0 协议开源,详见 [LICENSE](./LICENSE) 文件。
---
## 📈 Star增长
[](https://star-history.com/#meituan/EvoCUA&Date)
---