登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
登录
注册
9月20日,Gitee × 模力方舟来成都了!聚焦 AI 应用在开发范式、算力架构、交互设计、硬件选型等跨场景创新实践,点击立即报名~
代码拉取完成,页面将自动刷新
开源项目
>
人工智能
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
202
Star
1.3K
Fork
1.2K
GVP
Ascend
/
MindSpeed-LLM
代码
Issues
4
Pull Requests
49
Wiki
统计
流水线
服务
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
标签
标签名
描述
提交信息
操作
v2.1.0
一、新增模型及特性: 1、新增DeepSeekV3、Qwen3、Mamba2系列模型支持 2、增加MindSpore训练后端支持 二、删除: 不再支持模型Legacy分支 下线Mcore提供的Grok 三、变更说明: 1、功能变更: 四、已知问题: 无 五、Bugfix: 修复若干功能性问题 六、特殊声明: MC2 特性存在缺陷,目前不推荐用户使用
7f128db
2025-07-25 16:07
下载
查看发行版
v2.0.0
一、新增模型及特性: 1、发布DeepSeek-V3、DeepSeek-R1-Distill以及HunyuanLarge系列模型 2、qwen2.5全参微调与lora微调支持,支持QLoRA微调训练 二、删除: 无 三、变更说明: 1、功能变更: 环境变量 PYTORCH_NPU_ALLOC_CONF=expandable_segments:True 在本次 release 中继续使能虚拟内存,不配置默认为关闭虚拟内存 四、已知问题: 无 五、Bugfix: 修复若干功能性问题 六、特殊声明: MC2 特性存在缺陷,目前不推荐用户使用
3a712f5
2025-04-27 10:58
下载
查看发行版
v1.0.0
一、新增模型及特性: 1、发布 DeepSeek-lite,QWen2.5 系列,InternLM2.5 系列模型 2、全面支持 DPO 后训练算法与各种并行切分策略组合 3、支持偏好数据集处理(Pairwise)与结果奖励模型(ORM) 4、支持长序列 pack 模式下的指令微调 5、支持 swap-attention、fp32参数副本等显存优化方式 二、删除: 无 三、变更说明: 1、功能变更: 环境变量 PYTORCH_NPU_ALLOC_CONF=expandable_segments:True 在本次 release 中继续使能虚拟内存,不配置默认为关闭虚拟内存 四、已知问题: 无 五、Bugfix: 修复若干功能性问题 六、特殊声明: MC2 特性存在缺陷,目前不推荐用户使用,代码侧已默认置为 False
062fb4f
2024-12-27 17:26
下载
查看发行版
v1.0.RC3.0
功能变更: 环境变量PYTORCH_NPU_ALLOC_CONF=expandable_segments:True使能虚拟内存,不配置默认为关闭虚拟内存 配套变更: MindSpeed配套升级至4ea42a23 commitid Megatron-LM配套升级至core r0.6.0分支 新增模型及特性: 新增支持模型deepseek系列、gemma2系列、GLM4系列、llama3.1系列、minicpm系列和qwen2系列模型 全面支持megatron mcore功能 全面支持moe结构,包括allgather、all2all能力与drop和dropless分支 全面支持huggingface、megatron-legacy、megatron-mcore权重互转能力 全面支持全参指令微调与lora低参指令微调能力 完成dpo训练能力demo
3110060
2024-10-16 17:29
下载
查看发行版
v1.0.RC2.0
功能变更: 1. 新版本--overlap-param-gather参数只支持mcore模型 2. jit-compile参数由环境变量控制转为--jit-compile脚本参数控制,不配置默认为false 3. 环境变量PYTORCH_NPU_ALLOC_CONF=expandable_segments:True使能虚拟内存,不配置默认为关闭虚拟内存 配套变更: 1. MindSpeed配套升级至2b0edd2 commitid 2. Megatron-LM配套升级至core r0.6.0分支 新增模型及特性: 1. 新增支持模型chatglm3、gpt3、codallama、yi、LLaMA3、Qwen1.5、Mistral-7B、gemma、aquila2模型 2. 非共享储存情况下非主节点数据缓存检测和生成 3. VPP权重转换 4. 确定性计算 5. profiling功能 6. 支持mc2,但默认不使能
321c3f0
2024-07-17 08:52
下载
查看发行版
v1.0.RC1.0
支持8个系列大模型,预训练、推理、评估,Megatron(23年11月底版本)插件化重构完成
f33da62
2024-04-16 10:22
下载
查看发行版
下载
请输入验证码,防止盗链导致资源被占用
取消
下载
Python
1
https://gitee.com/ascend/MindSpeed-LLM.git
git@gitee.com:ascend/MindSpeed-LLM.git
ascend
MindSpeed-LLM
MindSpeed-LLM
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册