205 Star 1.3K Fork 1.2K

Ascend/MindSpeed-LLM
暂停

【联通】deepseekV3 使用gemm参数后,lora微调后推理结果混乱

DONE
缺陷
创建于  
2025-02-24 20:54

评论 (1)

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(2)
14779515 shenjiarun 1745288233
Python
1
https://gitee.com/ascend/MindSpeed-LLM.git
git@gitee.com:ascend/MindSpeed-LLM.git
ascend
MindSpeed-LLM
MindSpeed-LLM

搜索帮助