# MindSpeed-RL **Repository Path**: guihaowen/MindSpeed-RL ## Basic Information - **Project Name**: MindSpeed-RL - **Description**: 昇腾强化学习加速库 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 290 - **Created**: 2025-08-25 - **Last Updated**: 2025-08-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
| 依赖软件 | 版本 |
|---|---|
| 昇腾NPU驱动 | 在研版本 |
| 昇腾NPU固件 | |
| Toolkit(开发套件) | 在研版本 |
| Kernel(算子包) | |
| NNAL(Ascend Transformer Boost加速库) | |
| Python | PT配套版本 |
| PyTorch | 2.5 |
| torch_npu插件 | 在研版本 |
| apex |
| 训练算法 | 训练指南 | 支持模型 | 发布状态 |
|---|---|---|---|
| GRPO | Doc |
Qwen2.5-7B Qwen2.5-32B |
Released |
| Doc |
Qwen2.5VL-3B Qwen2.5VL-7B Qwen2.5VL-32B |
Released | |
| Doc |
Qwen3-8B Qwen3-235B-A22B DeepSeek-R1-671B |
Preview | |
| DAPO | Doc |
Qwen2.5-32B Qwen3-30B-A3B Qwen3-32B |
Preview |
| PPO | Doc |
Qwen2.5-32B |
Preview |
| DPO | Doc |
Qwen3-30B-A3B |
Preview |
| 核心特性 | 特性指南 | 适用算法 | 发布状态 |
|---|---|---|---|
| 训推共卡 | Doc |
GRPO DAPO PPO |
Released |
| 数据调度 | Doc |
GRPO DAPO PPO |
Preview |
| 权重重切分 | Doc |
GRPO DAPO PPO |
Preview |
| 填充移除 | Doc |
GRPO DAPO PPO |
Preview |
| 长序列并行 | Doc |
GRPO DAPO PPO DPO |
Preview |
| Partial Rollout | Doc |
GRPO |
Preview |
| 工具特性 | 特性指南 | 适用算法 | 发布状态 |
|---|---|---|---|
| 训练监控 | Doc |
GRPO DAPO PPO DPO |
Preview |
| 性能调优 | Doc |
GRPO DAPO PPO DPO |
Preview |
| 精度分析 | Doc |
GRPO DAPO PPO |
Preview |
| 确定性计算 | Doc |
GRPO DAPO PPO DPO |
Preview |