微调DeepSeek-R1-Distill-Llama-8B模型,提供详细的解析和清晰的答案,致力于实现更好的高考题答疑。
微调DeepSeek-R1-Distill-Llama-8B模型,提供详细的解析和清晰的答案,致力于实现更好的高考题答疑。
加载medical- o1-reasoning-sft数据集,使用lora对deepseekr1-distill-llama8b进行微调,致力于复杂的医学推理问答,更好地帮助患者了解病情,提出解决方案。
本项目利用矿物学专业知识和Light-RAG框架,构建了一个矿物学领域知识图谱,为大模型提供了一个稳健的外接知识库;构造问答正负例数据微调BGE-reranker-v2-m3后,对Light-RAG框架初步召回的数据进行细粒度重排,进一步提升Light-RAG框架的检索性能
本项目从零开始构建了一个具有千万参数的大模型,工作包含了预训练、全量微调、蒸馏三个主要阶段,逐步打造了一个能够较流畅实现问答功能的大模型基座。
最近一年贡献:19 次
最长连续贡献:1 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。