https://github.com/gitcodeaction/slime.git
Benchmarking Goal-Oriented Software Engineering
Claw-Eval is an evaluation harness for evaluating LLM as agents. All tasks verified by humans.
https://github.com/openclaw/openclaw
https://github.com/gitcodeaction/dynamo
请描述组织的定位/愿景 请附上组织宣传图
这些公司或软件正在使用我们的开源软件:
请发送申请邮件至
如果您觉得我们的开源软件对你有所帮助,请扫下方二维码打赏我们一杯咖啡。
网站: Follow @aaa on Weibo 邮箱: