ConvertWeight

基本介绍

ConvertWeight支持对torch权重和mindspore权重的格式互转

支持模型

name
llama	llama
glm	glm
glm-n	glm2、glm3
qwen	qwen
internlm	internlm
baichuan	baichuan、baichuan2
gpt	gpt2
bloom	bloom
wizardcoder	wizardcoder
skywork	skywork
mixtral	mixtral

使用方式

启动权重转换脚本

脚本：

根目录下convert_weight.py

主要参数;

args		required
model	模型名称	是
reversed	mindspore格式转torch格式	否
input_path	输入权重文件路径，如果模型存在多个权重文件，选择模型目录下其中一个即可，根据目录自动加载全部权重	是
output_path	输出权重文件路径	是
dtype	输出的权重数据类型,默认为原始权重数据类型	否
n_head	bloom权重转换所需额外参数，根据bloom模型实际情况配置	否
hidden_size	bloom权重转换所需额外参数，根据bloom模型实际情况配置	否
layers	gpt2和wizardcoder的torch权重转mindspore权重时所需的额外参数，转换的权重层数	否
is_pretrain	swin权重转换所需额外参数，输入权重是否为预训练权重	否

执行：

python convert_weight.py --model model_name --inpurt_path ./hf/input.bin --output_path ./ms/output.ckpt --otherargs
python convert_weight.py --model model_name --inpurt_path ./ms/output.ckpt --output_path ./hf/input.bin --reversed --otherargs
# Example for llama:
# python convert_weight.py --model llama --input_path open_llama_7b.ckpt --output_path llama_7b.bin --reversed

扩展

在扩展模型目录下新增convert_weight.py及convert_reversed.py文件，
在文件中分别编写conver_ms_to_pt及conver_pt_to_ms权重转换函数，函数参数为input_path、output_path、dtype及额外参数**kwargs
在mindformers根目录下convert_weight.py文件中的convert_map和reversed_convert_map字典中加入扩展模型名称及转换函数引入路径
额外参数在main函数中通过parser.add_argument('--arg_name',default=,type=,required=,help=)新增

MindSpore / mindformers

ConvertWeight

基本介绍

支持模型

使用方式

启动权重转换脚本

扩展

简介

发行版 (4)

贡献者

近期动态

MindSpore / mindformers .gitee-modal { width: 500px !important; }

ConvertWeight

基本介绍

支持模型

使用方式

启动权重转换脚本

扩展

简介

发行版 (4)

开源评估指数源自 OSS-Compass 评估体系，评估体系围绕以下三个维度对项目展开评估：

贡献者

近期动态

搜索帮助

MindSpore / mindformers