# firefly_my **Repository Path**: zhao_yingbo/firefly_my ## Basic Information - **Project Name**: firefly_my - **Description**: No description available - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-04-06 - **Last Updated**: 2024-04-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ### 一.快速启动训练 以codellama和qlora为例,训练依赖两份文件: -配置文件,如train_args/qlora/codellama/codellama2-34b-sft-qlora_26k.json --此文件记录了模型训练所必要的training_args,包括训练集路径,调参,保存目录等 -训练脚本,如train_qlora.py --模型训练文件 ## 1.1 单卡后台启动 如用CUDA:1单卡启动QLoRA训练,其中配置文件为train_args_file的传参;训练脚本会启动tensorboard记录训练过程。 CUDA_VISIBLE_DEVICES=1 nohup python -u train_qlora.py --train_args_file train_args/qlora/codegeex2/codegeex2-6b-sft-qlora_bird.json > run_codegeex2-6b-sft-qlora_bird.log 2>&1 & ## 1.2 训练过程查看 tensorboard --logdir=配置文件中配置的保存目录 ## BIRD评估 对于text2sql任务,我们整合了bird_eval的方法,用于评估准确率; ## 准备推理结果 首先需要准备一份待评估模型对dev数据的推理结果