https://github.com/langfuse/langfuse
https://github.com/openclaw/openclaw
https://github.com/AgentOps-AI/agentops
https://github.com/stepfun-ai/gelab-zero
https://github.com/mannaandpoem/OpenManus.git
https://github.com/mannaandpoem/OpenManus_Archive
https://github.com/FoundationAgents/OpenManus
https://github.com/mannaandpoem/OpenManus.git
https://github.com/web-infra-dev/midscene
MCP服务器可视化检测工具 https://github.com/modelcontextprotocol/inspector
https://github.com/minhalvp/android-mcp-server
基于Vue3+Element Plus+FastAPI开发的一个通用中后台管理框架(若依的FastAPI版本),支持代码生成
基于python的网页自动化工具。既能控制浏览器,也能收发数据包。可兼顾浏览器自动化的便利性和requests的高效率。功能强大,内置无数人性化设计和便捷功能。语法简洁而优雅,代码量少。
来自 https://github.com/deepseek-ai/DeepSeek-OCR
Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台
原库 https://github.com/RapidAI/RapidOCR
Myolotrain是一个可视化管理yolo视觉模型训练的系统,为计算机视觉任务提供了直观的图形界面。该平台集成了数据集管理、模型管理、训练管理和目标检测功能,支持windows、linux、docker等多种部署方式,使用户能够轻松地训练和部署 YOLOv8 模型,支持CPU和GPU,使用tensorboard实时查看训练进度,具备数据集自动分割功能。
2025年2月17日,微软发布了革命性的视觉Agent框架OmniParser V2。这个能把DeepSeek-R1、GPT-4o等大模型变成"计算机使用智能体"的黑科技,让AI终于不再只是"脑补"屏幕内容——它现在能像人类一样精准识别UI元素,甚至能发现你都没注意到的隐藏按钮!