Star_Platium (Star_Platium)

微调DeepSeek-R1-Distill-Llama-8B模型，提供详细的解析和清晰的答案，致力于实现更好的高考题答疑。

加载medical- o1-reasoning-sft数据集，使用lora对deepseekr1-distill-llama8b进行微调，致力于复杂的医学推理问答，更好地帮助患者了解病情，提出解决方案。

本项目利用矿物学专业知识和Light-RAG框架，构建了一个矿物学领域知识图谱，为大模型提供了一个稳健的外接知识库；构造问答正负例数据微调BGE-reranker-v2-m3后，对Light-RAG框架初步召回的数据进行细粒度重排，进一步提升Light-RAG框架的检索性能

本仓库存储电磁数据在线评价网站的机器学习代码。

本项目从零开始构建了一个具有千万参数的大模型，工作包含了预训练、全量微调、蒸馏三个主要阶段，逐步打造了一个能够较流畅实现问答功能的大模型基座。

Star_Platium