# LLMs-Zero-to-Hero **Repository Path**: frappe/LLMs-Zero-to-Hero ## Basic Information - **Project Name**: LLMs-Zero-to-Hero - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-02-05 - **Last Updated**: 2025-02-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

《LLMs-Zero-to-Hero》

从大模型无名小卒到LLM大师

开个新坑,从无名小卒到大模型(LLM)大英雄~ 欢迎关注[B站后续更新](https://space.bilibili.com/12420432)!!! ## 特点 - 完全从零手写,边写边讲知识点,致敬 Andrej Karpathy - 体系化,具有完整的实践路线 - 配套视频讲解,[B站视频](https://www.bilibili.com/video/BV1qWwke5E3K) - 配套镜像 GPU,用于模型的训练,有演示和展示 Demo - 最小使用 3090,4090 即可训练~ > 大家可以用我的 [AIStackDC 注册链接](https://aistackdc.com/phone-register?invite_code=D872A9)获得额外的 GPU 优惠券,2 张 1 折优惠券(5 小时)和 3 张 5 折优惠券(36 小时)。 ## 目录 - 大模型基础,介绍大模型训练的流程 - [Dense Model](https://github.com/bbruceyuan/LLMs-Zero-to-Hero/blob/master/src/video/build_gpt.ipynb) ([B站视频](https://www.bilibili.com/video/BV1qWwke5E3K)) - [MOE Model](https://github.com/bbruceyuan/LLMs-Zero-to-Hero/blob/master/src/video/build_moe_model.ipynb),([B站视频](https://www.bilibili.com/video/BV1ZbFpeHEYr/)) - ... - 完全从零到一训练 LLM (Pre-Training) - 完全从零到一微调 LLM (Supervised Fine-Tuning, SFT) - 完全从零到一微调 LLM (Direct Preference Optimization, DPO) - 完全从零到一微调 LLM (Reinforcement Learning from Human Feedback, RLHF) - 用于写 Python 代码的 Code-LLM - 大模型的部署 - 推理优化,量化等 - ... > 如果本套教程对你有难度,可以看看 [Hands-On Large Language Models CN(ZH) -- 动手学大模型](https://github.com/bbruceyuan/Hands-On-Large-Language-Models-CN),先使用 `transformers` 入门,然后再来手把手自己实现大模型。 ## 已更新内容目录 | 章节 | 文章解读 | 中文 Notebook
复制后可直接运行| 视频讲解
(可点击)| |---|---|------|------| | 完全从零手写一个nanoGPT | todo | [![中文可运行 Notebook](https://img.shields.io/badge/notebook-代码-pink)](https://github.com/bbruceyuan/LLMs-Zero-to-Hero/blob/master/src/video/build_gpt.ipynb) | [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1qWwke5E3K)](https://www.bilibili.com/video/BV1qWwke5E3K/)
[![Youtube](https://img.shields.io/youtube/views/2g5-aHYWiio)](https://www.youtube.com/watch?v=2g5-aHYWiio) | | LLM MOE 的进化之路 | [LLM MOE的进化之路,从普通简化 MOE,到 sparse_moe,再到 deepseek 使用的 share_expert_sparse_moe](https://bruceyuan.com/llms-zero-to-hero/the-way-of-moe-model-evolution.html) | [![中文可运行 Notebook](https://img.shields.io/badge/notebook-代码-pink)](https://github.com/bbruceyuan/LLMs-Zero-to-Hero/blob/master/src/video/build_moe_model.ipynb) | [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1ZbFpeHEYr)](https://www.bilibili.com/video/BV1ZbFpeHEYr/)
[![Youtube](https://img.shields.io/youtube/views/0BodppoiloM)](https://www.youtube.com/watch?v=0BodppoiloM) | | 激活函数优化| [LLM activate function激活函数的进化之路,从 ReLU,GELU 到 swishGLU](https://bruceyuan.com/llms-zero-to-hero/activate-function-from-relu-gelu-to-swishglu.html) | todo | todo | ## 代码仓库结构 ``` ├── chapter01 # 不同章节的学习笔记,最终会形成一本书籍 │ ├── README.md │ ├── ... ├── chapter02 │ ├── README.md │ ├── train.py │ ├── ... ├── src/ │ ├── hero/ # 最终自研实现的大模型等会放到这个地方; │ ├── chapter01/ # 这里会存放 chapter01 的代码; │ ├── chapter02/ # 这里会存放 chapter02 的代码; │ ├── video/ # 录制视频的时候用到的代码; ├── README.md ``` 陆续会更新,欢迎关注!!! - 方式 1:可以加我 wx: bbruceyuan ([扫码链接](https://bruceyuan.com/llms-zero-to-hero/wechat-account-bbruceyuan.png)) 来群里催更或者**反馈问题**~ - 方式 2:关注我的博客:[chaofa用代码打点酱油](https://www.bbruceyuan.com/) **(推荐)** - 方式 3: 关注我的公众号: [chafa用代码打点酱油](https://bruceyuan.com/llms-zero-to-hero/chaofa-wechat-official-account.png) > 公众号是 blog 的备份,也是一种提醒方式,也可以➕我好友,但是更好的阅读体验需要是 blog。
chaofa用代码打点酱油-公众号
> 最后欢迎大家使用 [AIStackDC](https://aistackdc.com/phone-register?invite_code=D872A9) 算力平台,主打一个便宜方便(有专门的客服支持),如果你需要的话可以使用我的邀请链接: [https://aistackdc.com/phone-register?invite_code=D872A9](https://aistackdc.com/phone-register?invite_code=D872A9)