当前仓库属于暂停状态,部分功能使用受限,详情请查阅 仓库状态说明
15 Star 429 Fork 290

GVPAscend/MindSpeed-RL
暂停

adaptive kl_ctrl实现是否存在问题

TODO
训练问题
创建于  
2025-05-15 18:11

评论 (0)

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(1)
1
https://gitee.com/ascend/MindSpeed-RL.git
git@gitee.com:ascend/MindSpeed-RL.git
ascend
MindSpeed-RL
MindSpeed-RL

搜索帮助