# AI-fundermentals
**Repository Path**: e-mano2/AI-fundermentals
## Basic Information
- **Project Name**: AI-fundermentals
- **Description**: https://github.com/ForceInjection/AI-fundermentals
- **Primary Language**: Unknown
- **License**: Apache-2.0
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-08-14
- **Last Updated**: 2025-08-14
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# AI Fundamentals
本仓库是一个全面的人工智能基础设施(`AI Infrastructure`)学习资源集合,涵盖从硬件基础到高级应用的完整技术栈。内容包括GPU架构与编程、`CUDA` 开发、大语言模型、`AI` 系统设计、性能优化、企业级部署等核心领域,旨在为`AI` 工程师、研究人员和技术爱好者提供系统性的学习路径和实践指导。
> **适用人群**:`AI` 工程师、系统架构师、GPU编程开发者、大模型应用开发者、技术研究人员。
> **技术栈**:`CUDA`、`GPU` 架构、`LLM`、`AI` 系统、分布式计算、容器化部署、性能优化。
## 1. 硬件与基础设施
### 1.1 硬件基础知识
- [PCIe 知识大全](https://mp.weixin.qq.com/s/dHvKYcZoa4rcF90LLyo_0A)
- [NVLink 入门](https://mp.weixin.qq.com/s/fP69UEgusOa_X4ZKLo30ig)
- [NVIDIA DGX SuperPOD:下一代可扩展的AI领导基础设施](https://mp.weixin.qq.com/s/a64Qb6DuAAZnCTBy8g1p2Q)
### 1.2 GPU 架构深度解析
在准备在 `GPU` 上运行的应用程序时,了解 `GPU` 硬件设计的主要特性并了解与 `CPU` 的相似之处和不同之处会很有帮助。本路线图适用于那些对 `GPU` 比较陌生或只是想了解更多有关 `GPU` 中计算机技术的人。不需要特定的并行编程经验,练习基于 `CUDA` 工具包中包含的标准 `NVIDIA` 示例程序。
- [**GPU 特性**](gpu_architecture/gpu_characteristics.md)
- [**GPU 内存**](gpu_architecture/gpu_memory.md)
- [**GPU Example: Tesla V100**](gpu_architecture/tesla_v100.md)
- [**GPUs on Frontera: RTX 5000**](gpu_architecture/rtx_5000.md)
- **练习**:
- [**Exercise: Device Query**](gpu_architecture/exer_device_query.md)
- [**Exercise: Device Bandwidth**](gpu_architecture/exer_device_bandwidth.md)
#### 1.2.1 GPU 架构和编程模型介绍
- [**GPU Architecture and Programming — An Introduction**](gpu_programming/gpu_programming_introduction.md) - GPU架构与编程模型的全面介绍
#### 1.2.2 CUDA 核心技术
- [**深入理解 Nvidia CUDA 核心(vs. Tensor Cores vs. RT Cores)**](cuda/cuda_cores_cn.md)
### 1.3 AI 基础设施架构
- [**高性能 GPU 服务器硬件拓扑与集群组网**](https://arthurchiao.art/blog/gpu-advanced-notes-1-zh/)
- [**NVIDIA GH200 芯片、服务器及集群组网**](https://arthurchiao.art/blog/gpu-advanced-notes-4-zh/)
- [**深度学习(大模型)中的精度**](https://mp.weixin.qq.com/s/b08gFicrKNCfrwSlpsecmQ)
### 1.4 AI 基础设施课程
**完整的AI基础设施技术课程体系:**
- [**在线课程演示**](ai_infra_course/index.html) - 交互式课程演示(包含37个页面的完整课程内容)
**课程内容概览:**
- **大模型原理与最新进展**:`Transformer` 架构、训练规模、`DeepSeek` 技术突破、能力涌现现象
- **AI编程技术**:`GitHub Copilot`、`Cursor`、`Trae AI` 等工具对比,实际应用场景和效率数据
- **GPU架构与CUDA编程**:`GPU vs CPU`对比、`NVIDIA` 架构演进、`CUDA` 编程模型、性能优化
- **云原生与AI Infra融合**:推理优化技术、量化技术、`AIBrix` 架构、企业级部署实践
- **技术前沿与职业发展**:行业趋势分析、学习路径规划、职业发展建议
### 1.5 GPU 管理与虚拟化
**理论与架构:**
- [**GPU虚拟化与切分技术原理解析**](gpu_manager/GPU虚拟化与切分技术原理解析.md) - 技术原理深入
- [**GPU 管理相关技术深度解析 - 虚拟化、切分及远程调用**](gpu_manager/GPU%20管理相关技术深度解析%20-%20虚拟化、切分及远程调用.md) - 全面的GPU管理技术指南
- [**第一部分:基础理论篇**](gpu_manager/第一部分:基础理论篇.md) - GPU管理基础概念与理论
- [**第二部分:虚拟化技术篇**](gpu_manager/第二部分:虚拟化技术篇.md) - 硬件、内核、用户态虚拟化技术
- [**第三部分:资源管理与优化篇**](gpu_manager/第三部分:资源管理与优化篇.md) - GPU切分与资源调度算法
- [**第四部分:实践应用篇**](gpu_manager/第四部分:实践应用篇.md) - 部署、运维、性能调优实践
**GPU 虚拟化解决方案:**
- [**HAMi GPU 资源管理完整指南**](hami/hmai-gpu-resources-guide.md)
**运维工具与实践:**
- [**nvidia-smi 入门**](ops/nvidia-smi.md)
- [**nvtop 入门**](ops/nvtop.md)
- [**Nvidia GPU XID 故障码解析**](https://mp.weixin.qq.com/s/ekCnhr3qrhjuX_-CEyx65g)
- [**Nvidia GPU 卡 之 ECC 功能**](https://mp.weixin.qq.com/s/nmZVOQAyfFyesm79HzjUlQ)
- [**查询 GPU 卡详细参数**](ops/DeviceQuery.md)
- [**Understanding NVIDIA GPU Performance: Utilization vs. Saturation (2023)**](https://arthurchiao.art/blog/understanding-gpu-performance/)
- [**GPU 利用率是一个误导性指标**](ops/GPU%20利用率是一个误导性指标.md)
### 1.6 分布式存储系统
**JuiceFS 分布式文件系统:**
- [**JuiceFS 文件修改机制分析**](juicefs/JuiceFS%20文件修改机制分析.md) - 分布式文件系统的修改机制深度解析
- [**JuiceFS 后端存储变更手册**](juicefs/JuiceFS%20后端存储变更手册.md) - JuiceFS 后端存储迁移和变更操作指南
### 1.7 DeepSeek 技术研究
> 注意:相关内容为 2025 年春节完成,需要审慎参考!
**模型对比与评测:**
- [**DeepSeek-R1 模型对比分析**](deepseek/deepseek-r1-cmp.md) - 1.5b、7b、官网版本的性能对比与评测
- [**Mac 上运行 DeepSeek-R1 模型**](deepseek/mac-deepseek-r1.md) - 使用 Ollama 在 Mac 上本地部署 DeepSeek-R1
**分布式系统设计:**
- [**3FS 分布式文件系统**](deepseek/deepseek_3fs_design_notes.zh-CN.md) - 高性能分布式文件系统的设计理念与技术实现
- **系统架构**:集群管理器、元数据服务、存储服务、客户端四大组件
- **核心技术**:RDMA 网络、CRAQ 链式复制、异步零拷贝 API
- **性能优化**:FUSE 局限性分析、本地客户端设计、io_uring 启发的 API 设计
### 1.8 高性能网络与通信
#### 1.8.1 InfiniBand 网络技术
- [**InfiniBand 网络理论与实践**](InfiniBand/IB%20网络理论与实践.md) - InfiniBand网络架构、协议栈和性能优化
- [**InfiniBand 健康检查工具**](InfiniBand/health/README.md) - 网络健康状态监控和故障诊断
- [**InfiniBand 带宽监控**](InfiniBand/monitor/README.md) - 实时带宽监控和性能分析
#### 1.8.2 NCCL 分布式通信
- [**NCCL 分布式通信测试套件使用指南**](nccl/tutorial.md) - 单节点、多节点 `NCCL` 环境配置和调优
- [**NCCL Kubernetes 部署**](nccl/k8s/README.md) - 容器化NCCL集群部署方案
### 1.9 云原生 AI 基础设施
- [**云原生高性能分布式 LLM 推理框架 llm-d 介绍**](k8s/llm-d-intro.md) - 基于Kubernetes的大模型推理框架
- [**vLLM + LWS:Kubernetes 上的多机多卡推理方案**](k8s/lws_intro.md) - `LWS` 旨在提供一种 **更符合 AI 原生工作负载特点的分布式控制器语义**,填补现有原语在推理部署上的能力空白
### 1.10 性能分析与调优
- [**使用 Nsight Compute Tool 分析 CUDA 矩阵乘法程序**](https://www.yuque.com/u41800946/nquqpa/eo7gykiyhg8xi2gg)
- [**CUDA Kernel Profiling using Nvidia Nsight Compute**](profiling/s9345-cuda-kernel-profiling-using-nvidia-nsight-compute.pdf)
### 1.11 GPU 监控与运维工具
**GPU 性能监控:**
- [**GPU 利用率是一个误导性指标**](ops/GPU%20利用率是一个误导性指标.md) - 深入理解GPU利用率指标的局限性
- [**nvidia-smi 详解**](ops/nvidia-smi.md) - NVIDIA系统管理接口工具使用指南
- [**nvtop 使用指南**](ops/nvtop.md) - 交互式GPU监控工具
- [**DeviceQuery 工具**](ops/DeviceQuery.md) - CUDA设备查询工具详解
---
## 2. 开发与编程
本部分专注于AI开发相关的编程技术、工具和实践,涵盖从基础编程到高性能计算的完整技术栈。
### 2.1 AI 编程入门
- [**AI 编程入门完整教程**](coding/AI%20编程入门.md) - 从零开始的AI编程学习路径
- [**AI 编程入门在线版本**](coding/index.html) - 交互式在线学习体验
### 2.2 CUDA 编程与开发
- [**CUDA 核心概念详解**](cuda/cuda_cores_cn.md) - CUDA核心、线程块、网格等基础概念
- [**CUDA 流详解**](cuda/cuda_streams.md) - CUDA流的原理和应用
- [**GPU 编程基础**](gpu_programming/gpu_programming_introduction.md) - GPU编程入门和进阶
### 2.3 Trae 编程实战课程
**系统化的 Trae 编程学习体系:**
- [《Trae 编程实战》课程提纲](trae/《Trae%20编程实战》课程提纲(对外).md) - 完整的五部分21章课程规划
- **基础入门**:环境配置、交互模式、HelloWorld项目实战
- **场景实战**:前端开发、后端API、数据库设计、安全认证
- **高级应用**:AI集成、实时通信、数据分析、微服务架构
- **团队协作**:代码质量、版本控制、CI/CD、性能优化
- **综合项目**:企业级应用开发、部署运维实战
### 2.4 CUDA 学习材料
#### 2.4.1 快速入门
- [**并行计算、费林分类法和 CUDA 基本概念**](https://mp.weixin.qq.com/s/NL_Bz8JB-LdAtrQake7EdA)
- [**CUDA 编程模型入门**](https://mp.weixin.qq.com/s/IUYzzgt6DUYhfaDnbxoZuQ)
- [**CUDA 并发编程之 Stream 介绍**](cuda/cuda_streams.md)
#### 2.4.2 参考资料
- [**CUDA Reading Group 相关讲座**](https://mp.weixin.qq.com/s/6sOrNzG0UeVBes8stWSoWA): [GPU Mode Reading Group](https://github.com/gpu-mode)
- [**《CUDA C++ Programming Guide》**](https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html)
- [**《CUDA C 编程权威指南》**](https://mp.weixin.qq.com/s/xJY5Znv3cuQi_UCd_XjJ4A):[书中示例代码](https://github.com/Eddie-Wang1120/Professional-CUDA-C-Programming-Code-and-Notes)
- [**Nvidia 官方 CUDA 示例**](https://github.com/NVIDIA/cuda-samples)
- [**《CUDA 编程:基础与实践 by 樊哲勇》**](https://book.douban.com/subject/35252459/)
- [**学习笔记**](https://github.com/QINZHAOYU/CudaSteps)
- [**示例代码**](https://github.com/MAhaitao999/CUDA_Programming)
- [**《CUDA 编程简介: 基础与实践 by 李瑜》**](http://www.frankyongtju.cn/ToSeminars/hpc.pdf)
- [**《CUDA 编程入门》** - 本文改编自北京大学超算队 CUDA 教程讲义](https://hpcwiki.io/gpu/cuda/)
- [**Multi GPU Programming Models**](https://github.com/NVIDIA/multi-gpu-programming-models)
- [**CUDA Processing Streams**](https://turing.une.edu.au/~cosc330/lectures/display_lecture.php?lecture=22#1)
#### 2.4.3 专业选手
[**CUDA-Learn-Notes**](https://github.com/xlite-dev/CUDA-Learn-Notes):📚Modern CUDA Learn Notes: 200+ Tensor/CUDA Cores Kernels🎉, HGEMM, FA2 via MMA and CuTe, 98~100% TFLOPS of cuBLAS/FA2.
---
## 3. 机器学习基础
本部分基于 [**动手学机器学习**](https://github.com/ForceInjection/hands-on-ML) 项目,提供系统化的机器学习学习路径。
### 3.1 数学基础
- [**线性代数的本质**](https://www.bilibili.com/video/BV1ys411472E) - 3Blue1Brown可视化教程
- [**MIT 18.06 线性代数**](https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/) - Gilbert Strang经典课程
- [**概率论与统计学基础**](https://book.douban.com/subject/35798663/) - 贝叶斯定理、概率分布、最大似然估计
### 3.2 监督学习
#### 3.2.1 基础算法
- [**KNN算法**](hands-on-ML/nju_software/ch-03/动手学机器学习%20KNN%20算法.md) - K近邻算法理论与实现
- [**线性回归**](hands-on-ML/nju_software/ch-03/动手学机器学习线性回归算法.md) - 最小二乘法、正则化
- [**逻辑回归**](hands-on-ML/nju_software/ch-03/动手学机器学习逻辑回归算法.md) - 分类算法基础
- [**决策树**](hands-on-ML/nju_software/ch-03/动手学机器学习决策树算法.md) - ID3、C4.5、CART算法
- [**支持向量机**](hands-on-ML/nju_software/ch-03/动手学机器学习支持向量机算法.md) - 核技巧与软间隔
- [**朴素贝叶斯**](hands-on-ML/nju_software/ch-03/动手学机器学习朴素贝叶斯算法.md) - 概率分类器
#### 3.2.2 集成学习
- [**随机森林**](hands-on-ML/nju_software/ch-04/动手学机器学习随机森林算法.md) - Bagging集成方法
- [**AdaBoost**](hands-on-ML/nju_software/ch-04/Adaboost%20计算示例.md) - Boosting算法
- [**GBDT**](hands-on-ML/nju_software/ch-04/一文读懂GBDT.md) - 梯度提升决策树
- [**Stacking**](hands-on-ML/nju_software/ch-04/Kaggle房价预测中的集成技巧.md) - 模型堆叠技术
- [**集成学习概述**](hands-on-ML/nju_software/ch-04/一文深入了解机器学习之集成学习.md) - 集成学习理论与方法
### 3.3 无监督学习
#### 3.3.1 聚类算法
- [**K-means聚类**](hands-on-ML/nju_software/ch-05/动手学机器学习%20Kmeans%20聚类算法.md) - 基础聚类算法
- [**层次聚类**](hands-on-ML/nju_software/ch-05/动手学机器学习层次聚类算法.md) - 凝聚与分裂聚类
- [**DBSCAN**](hands-on-ML/nju_software/ch-05/动手学机器学习:DBSCAN%20密度聚类算法.md) - 密度聚类算法
#### 3.3.2 降维算法
- [**PCA主成分分析**](hands-on-ML/nju_software/ch-11/PCA降维算法详解.md) - 线性降维方法
- [**LDA线性判别分析**](hands-on-ML/nju_software/ch-11/LDA降维算法详解.md) - 监督降维技术
- [**PCA vs LDA比较**](hands-on-ML/nju_software/ch-11/PCA%20vs.%20LDA%20降维方法比较.md) - 降维方法对比分析
#### 3.3.3 概率模型
- [**EM算法**](hands-on-ML/nju_software/ch-06/一文了解%20EM%20算法.md) - 期望最大化算法
- [**高斯混合模型**](hands-on-ML/nju_software/ch-06/一文了解%20GMM%20算法.md) - GMM聚类方法
- [**最大似然估计**](hands-on-ML/nju_software/ch-06/最大似然估计(MLE)简介.md) - MLE理论基础
### 3.4 特征工程与模型优化
#### 3.4.1 特征工程
- [**特征工程概述**](hands-on-ML/nju_software/ch-07/特征工程.md) - 数据预处理、特征选择与变换
- [**特征选择方法**](hands-on-ML/nju_software/ch-10/特征选择方法概述.md) - 过滤法、包装法、嵌入法
- [**GBDT特征提取**](hands-on-ML/nju_software/ch-07/GBDT特征提取.md) - 基于树模型的特征工程
- [**时间序列特征提取**](hands-on-ML/nju_software/ch-07/时间序列数据及特征提取.md) - 时间序列数据处理
- [**词袋模型**](hands-on-ML/nju_software/ch-07/词袋模型介绍.md) - 文本特征工程
#### 3.4.2 模型评估
- [**模型评估方法**](hands-on-ML/nju_software/ch-08/图解机器学习-模型评估方法与准则.md) - 评估指标与交叉验证
- [**混淆矩阵评价指标**](hands-on-ML/nju_software/混淆矩阵评价指标.md) - 分类模型性能评估
- [**GridSearchCV**](hands-on-ML/nju_software/ch-09/gridsearchcv_intro.md) - 超参数优化实践
- [**L1 L2正则化**](hands-on-ML/nju_software/ch-09/L1_L2_intro.md) - 正则化方法介绍
- [**SMOTE采样**](hands-on-ML/nju_software/ch-09/SMOTE%20介绍.md) - 不平衡数据处理
### 3.5 推荐系统与概率图模型
#### 3.5.1 推荐系统
- [**推荐系统入门**](hands-on-ML/nju_software/ch-12/recommendation_intro.md) - 推荐算法概述
- [**协同过滤算法**](hands-on-ML/nju_software/ch-12/协同过滤推荐算法:原理、实现与分析.md) - 用户协同过滤与物品协同过滤
- [**基于内容的推荐**](hands-on-ML/nju_software/ch-12/基于内容的推荐算法:原理与实践.md) - 内容推荐算法
- [**矩阵分解推荐**](hands-on-ML/nju_software/ch-12/基于矩阵分解的推荐算法:原理与实践.md) - SVD推荐算法
- [**关联规则挖掘**](hands-on-ML/nju_software/ch-12/使用%20Apriori%20算法进行关联分析:原理与示例.md) - Apriori算法
#### 3.5.2 概率图模型
- [**贝叶斯网络**](hands-on-ML/nju_software/ch-13/一文读懂贝叶斯网络.md) - 概率图模型基础
- [**隐马尔可夫模型**](hands-on-ML/nju_software/ch-13/一文读懂隐马尔可夫模型(HMM).md) - 序列建模与状态推断
- [**马尔可夫模型**](hands-on-ML/nju_software/ch-13/马尔可夫模型简介.md) - 马尔可夫链基础
### 3.6 深度学习基础
- [**深度学习概述**](hands-on-ML/nju_software/ch-14/深度学习概述.md) - 深度学习理论与实践指南
- [**神经网络基础**](hands-on-ML/nju_software/ch-14/神经网络示例.md) - 感知机、多层感知机、反向传播
- [**什么是深度学习**](hands-on-ML/nju_software/ch-14/什么是深度学习?.md) - 深度学习入门介绍
### 3.7 实战项目
- [**泰坦尼克号幸存者预测**](hands-on-ML/nju_software/ch-03/使用决策树对泰坦尼克号幸存者数据进行分类.md) - 特征工程与分类实战
- [**朴素贝叶斯实例**](hands-on-ML/nju_software/ch-03/朴素贝叶斯计算:建筑工人打喷嚏后患感冒的概率.md) - 概率计算实例
- [**RFM用户分析**](hands-on-ML/nju_software/ch-07/数据探索-根据历史订单信息求RFM值.md) - 用户价值分析
- [**电影推荐系统**](hands-on-ML/nju_software/ch-12/movie-recommendation.ipynb) - 推荐算法实战
### 3.8 学习资源
#### 3.8.1 核心教材
- **《统计学习方法》** - 李航著,算法理论基础
- **《机器学习》** - 周志华著,西瓜书经典
- **《模式识别与机器学习》** - Bishop著,数学严谨
#### 3.8.2 在线资源
- [**机器学习考试复习提纲**](hands-on-ML/nju_software/机器学习考试复习提纲.md) - 考试重点总结
- [**梯度下降算法详解**](hands-on-ML/nju_software/梯度下降算法:从直觉到实践.md) - 优化算法理解
- [**机器学习核心概念**](hands-on-ML/nju_software/通俗理解机器学习核心概念.md) - 概念通俗解释
- [**Andrew Ng机器学习课程**](https://www.coursera.org/learn/machine-learning) - Coursera经典课程
- [**CS229机器学习**](http://cs229.stanford.edu/) - 斯坦福大学课程
#### 3.8.3 实践平台
- [**Kaggle**](https://www.kaggle.com/) - 数据科学竞赛平台
- [**Google Colab**](https://colab.research.google.com/) - 免费GPU环境
- [**scikit-learn**](https://scikit-learn.org/) - Python机器学习库
---
## 4. 大语言模型基础
### 4.1 核心概念
- [**Andrej Karpathy:Deep Dive into LLMs like ChatGPT(B站视频)**](https://www.bilibili.com/video/BV16cNEeXEer)
- [**大模型基础组件 - Tokenizer**](https://zhuanlan.zhihu.com/p/651430181)
- [**解密大语言模型中的 Tokens**](llm/token/llm_token_intro.md)
- [**Tiktokenizer 在线版**](https://tiktokenizer.vercel.app/?model=gpt-4o)
- [**文本嵌入(Text-Embedding) 技术快速入门**](llm/embedding/text_embeddings_guide.md)
- [**LLM 嵌入技术详解:图文指南**](llm/embedding/LLM%20Embeddings%20Explained%20-%20A%20Visual%20and%20Intuitive%20Guide.zh-CN.md)
- [**大模型 Embedding 层与独立 Embedding 模型:区别与联系**](llm/embedding/embedding.md)
- [**大模型可视化指南**](https://www.maartengrootendorst.com/)
- [**一文读懂思维链(Chain-of-Thought, CoT)**](llm/一文读懂思维链(Chain-of-Thought,%20CoT).md)
- [**大模型的幻觉及其应对措施**](llm/大模型的幻觉及其应对措施.md)
- [**大模型文件格式完整指南**](llm/大模型文件格式完整指南.md)
- [**混合专家系统(MoE)图解指南**](llm/A%20Visual%20Guide%20to%20Mixture%20of%20Experts%20(MoE).zh-CN.md)
- [**量化技术可视化指南**](llm/A%20Visual%20Guide%20to%20Quantization.zh-CN.md)
- [**基于大型语言模型的意图检测**](llm/Intent%20Detection%20using%20LLM.zh-CN.md)
### 4.2 参考书籍
- [**大模型基础**](https://github.com/ZJU-LLMs/Foundations-of-LLMs)
- [**Hands-On Large Language Models**](https://github.com/HandsOnLLM/Hands-On-Large-Language-Models)
- [**从零构建大模型**](https://mp.weixin.qq.com/s/FkBjsQmeXEPlsdFXETYSng)
- [**百面大模型**](https://mp.weixin.qq.com/s/rBJ5an0pr3TgjFbyJXa0WA)
- [**图解大模型:生成式AI原理与实践**](https://mp.weixin.qq.com/s/tYrHrpMrZySgWKE1ECqTWg)
---
## 5. 大模型训练
### 5.1 微调技术
- [**大模型训练与推理**](llm/大模型训练与推理.md)
- [**Qwen 2 大模型指令微调入门实战**](llm/Qwen%202%20大模型指令微调入门实战.md)
- [**一文入门垂域模型SFT微调**](llm/一文入门垂域模型SFT微调.md)
### 5.2 从零开始训练
- [**从零开始训练大模型**](llm/从零开始训练大模型.md)
- [**Training a 70B model from scratch: open-source tools, evaluation datasets, and learnings**](https://imbue.com/research/70b-intro/)
- [**Sanitized open-source datasets for natural language and code understanding: how we evaluated our 70B model**](https://imbue.com/research/70b-evals/)
- [**From bare metal to a 70B model: infrastructure set-up and scripts**](https://imbue.com/research/70b-infrastructure/)
- [**Open-sourcing CARBS: how we used our hyperparameter optimizer to scale up to a 70B-parameter language model**](https://imbue.com/research/70b-carbs/)
---
## 6. 大模型推理
### 6.1 推理系统架构
- [**模型推理**](llm/模型推理.md)
- [**Mooncake 架构详解**](llm/Mooncake%20架构详解.md)
### 6.2 模型部署实践
- [**动手部署 ollama**](llm/动手部署%20ollama.md)
- [**DeepSeek 模型部署与对比**](llm/DeepSeek%20模型部署与对比.md)
### 6.3 推理优化技术
完整的AI推理优化技术文档系列,涵盖从小型到大型集群的推理优化策略:
- [**AI推理优化技术文档导航**](inference/README.md)
- [**背景与目标**](inference/01-背景与目标.md)
- [**集群规模分类与特征分析**](inference/02-集群规模分类与特征分析.md)
- [**核心推理优化技术深度解析**](inference/03-核心推理优化技术深度解析.md)
- [**不同集群规模的技术选型策略**](inference/04-不同集群规模的技术选型策略.md)
- [**性能评估指标体系**](inference/05-性能评估指标体系.md)
- [**推理服务架构设计**](inference/06-推理服务架构设计.md)
- [**实施建议与最佳实践**](inference/07-实施建议与最佳实践.md)
- [**参考资料与延伸阅读**](inference/08-参考资料与延伸阅读.md)
- [**安全性与合规性**](inference/09-安全性与合规性.md)
- [**多模态推理优化**](inference/10-多模态推理优化.md)
- [**边缘推理优化**](inference/11-边缘推理优化.md)
- [**场景问题解答**](inference/12-场景问题解答.md)
- [**实施检查清单**](inference/13-实施检查清单.md)
- [**总结与展望**](inference/14-总结与展望.md)
---
## 7. 企业级 AI Agent 开发
### 7.1 上下文工程
**理论基础与实践应用:**
- [**上下文工程原理**](context/上下文工程原理.md) - 基于中科院权威论文的系统性理论阐述
- **核心定义**:从提示工程到上下文工程的范式转变
- **理论框架**:信息检索、选择、组装、压缩和动态调整
- **技术架构**:多模态融合、状态管理、智能组装
- **企业应用**:全生命周期管理和系统化自动优化
- [**上下文工程原理简介**](context/上下文工程原理简介.md) - 深入浅出的入门指南
- **生活化类比**:从聊天机器人到智能助手的进化
- **核心特征**:系统性方法、动态优化、多模态融合、状态管理、智能组装
- **技术对比**:与传统提示词工程的区别与联系
- [**基于上下文工程的 LangChain 智能体应用**](context/langchain_with_context_engineering.md) - LangChain 实践指南
- **框架构建**:行为准则、信息接入、会话记忆、工具集成、用户画像
- **技术实现**:LangChain 与 LangGraph 的上下文工程实践
- **问题解决**:上下文污染、干扰、混淆、冲突的处理策略
- **性能优化**:令牌消耗控制、成本与延迟优化
### 7.2 RAG 技术
- [**RAG 技术概述**](llm/rag/README.md)
- [**从0到1快速搭建RAG应用**](llm/rag/写作%20Agentic%20Agent.md)
- [**配套代码**](llm/rag/lession2.ipynb)
- [**Evaluating Chunking Strategies for Retrieval 总结**](llm/rag/Evaluating%20Chunking%20Strategies%20for%20Retrieval%20总结.md)
- [**中文RAG系统Embedding模型选型技术文档**](llm/rag/中文RAG系统Embedding模型选型技术文档.md)
### 7.3 AI Agent 框架与工具
**Python 生态:**
- [**LangChain + 模型上下文协议(MCP):AI 智能体 Demo**](llm/agent/README.md)
- [**AI Agents for Beginners 课程之 AI Agent及使用场景简介**](llm/AI%20Agents%20for%20Beginners%20课程之%20AI%20Agent及使用场景简介.md)
- [**A Deep Dive Into MCP and the Future of AI Tooling**](llm/mcp/A_Deep_Dive_Into_MCP_and_the_Future_of_AI_Tooling_zh_CN.md)
- [**LangGraph 实战:用 Python 打造有状态智能体**](llm/langgraph/langgraph_intro.md)
- [**使用 n8n 构建多智能体系统的实践指南**](llm/n8n_multi_agent_guide.md)
- [**开源大模型应用编排平台:Dify、AnythingLLM、Ragflow 与 n8n 的功能与商用许可对比分析**](llm/开源大模型应用编排平台:Dify、AnythingLLM、Ragflow%20与%20n8n%20的功能与商用许可对比分析.md)
**Java 生态:**
- [**使用 Spring AI 构建高效 LLM 代理**](java_ai/spring_ai_cn.md) - Spring AI 代理模式实现指南
- **代理系统架构**:工作流 vs 代理的设计理念对比
- **五种基本模式**:链式工作流、路由工作流、并行化、编排、评估
- **企业级实践**:可预测性、一致性、可维护性的平衡
### 7.4 企业级多智能体系统
**核心理论文档:**
- [**多智能体AI系统基础:理论与框架**](agent/Part1-Multi-Agent-AI-Fundamentals.md) - 多智能体系统的核心理论、技术框架和LangGraph/LangSmith深度解析
- [**企业级多智能体系统实现指南**](agent/Part2-Enterprise-Multi-Agent-System-Implementation.md) - 完整的企业级多智能体系统架构设计与实现
**企业级培训材料:**
- [**多智能体AI系统培训材料**](agent/multi_agent_training/README.md) - 5天40学时的完整培训体系
- [**多智能体系统概论**](agent/multi_agent_training/01-理论基础/01-多智能体系统概论.md) - BDI架构、协作机制、系统优势
- [**LangGraph深度应用**](agent/multi_agent_training/02-LangGraph框架/02-LangGraph深度应用.md) - 工作流编排引擎深度应用
- [**LangSmith监控平台集成**](agent/multi_agent_training/03-LangSmith监控/03-LangSmith监控平台集成.md) - 全链路追踪、告警、性能优化
- [**企业级系统架构设计与实现**](agent/multi_agent_training/04-企业级架构/04-企业级系统架构设计与实现.md) - 架构设计、技术实现、代码实践
- [**应用实践与部署运维**](agent/multi_agent_training/05-应用实践/05-应用实践与部署运维.md) - 智能客服、部署、最佳实践
**培训特色:**
- **理论实践结合**:从抽象理论到具体实现的完整转化路径
- **技术栈全覆盖**:LangGraph工作流编排 + LangSmith全链路监控
- **企业级标准**:高可用性架构、安全机制、性能优化、运维最佳实践
- **完整项目案例**:智能客服系统、内容创作平台、金融分析系统
- **技术实现**:Spring AI 的模型可移植性和结构化输出功能
### 7.5 模型上下文协议(MCP)
- [**模型上下文协议(MCP)**](llm/mcp/模型上下文协议(MCP).md)
- [**MCP 技术指南**](llm/mcp/MCP%20技术指南.md)
- [**MCP 深度解析与 AI 工具未来**](llm/mcp/MCP%20深度解析与%20AI%20工具未来.md)
### 7.6 AI 智能体记忆系统
- [**AI 智能体记忆系统:理论与实践**](memory/AI%20智能体记忆系统:理论与实践.md)
- [**如何设计支持多轮指代消解的对话系统**](memory/如何设计支持多轮指代消解的对话系统.md)
- [**记忆系统代码实现**](memory/code/README.md)
---
## 8. 实践案例
### 8.1 模型部署与推理
- [**动手部署 ollama**](llm/ollama/README.md)
### 8.2 文档处理工具
- [**深入探索:AI 驱动的 PDF 布局检测引擎源代码解析**](llm/marker.zh-CN.md)
- [**上海人工智能实验室开源工具 MinerU 助力复杂 PDF 高效解析提取**](llm/minerU_intro.md)
- [**Markitdown 入门**](llm/markitdown/README.md)
- [**DeepWiki 使用方法与技术原理深度分析**](llm/DeepWiki%20使用方法与技术原理深度分析.md)
### 8.3 特定领域应用
- [**读者来信:请问7b阅读分析不同中医古籍的能力怎么样?可以进行专项训练大幅度提高这方面能力么?**](llm/scenario/traditional-chinese-medicine.md)
- [**中国大陆合同审核要点清单**](llm/scenario/中国大陆合同审核要点清单.md)
- [**让用户"说半句"话也能懂:ChatBox 的意图识别与语义理解机制解析**](llm/让用户"说半句"话也能懂:ChatBox%20的意图识别与语义理解机制解析.md)
---
## 9. 工具与资源
### 9.1 AI 系统学习资源
[**AISystem**](AISystem/README.md) - 完整的AI系统学习资源,包含:
- [**系统介绍**](AISystem/01Introduction/README.md) - AI系统概述与发展历程
- [**硬件基础**](AISystem/02Hardware/README.md) - AI芯片与硬件架构
- [**编译器技术**](AISystem/03Compiler/README.md) - AI编译器原理与实践
- [**推理优化**](AISystem/04Inference/README.md) - 模型推理加速技术
- [**框架设计**](AISystem/05Framework/README.md) - AI框架架构与并行计算
### 9.2 AI 基础设施专业课程
- [**大模型原理与最新进展**](ai_infra_course/index.html)
- [**AI Infra 课程演讲稿**](ai_infra_course/讲稿.md) - 完整的课程演讲内容和技术要点
- **学习目标**:深入理解大模型工作原理和最新技术进展
- **核心内容**:
- **Transformer架构**:编码器-解码器结构、注意力机制、文本生成过程
- **训练规模数据**:GPT-3/4、PaLM等主流模型的参数量、成本和资源需求
- **DeepSeek模型演进**:V1/V2/R1三代技术突破、MLA架构创新、MoE优化
- **能力涌现现象**:规模效应、临界点突破、多模态发展趋势
- **AI编程工具**:GitHub Copilot、Cursor、Trae AI等工具对比和应用实践
- **GPU架构与CUDA**:硬件基础、并行计算原理、性能优化策略
- **云原生AI架构**:现代化AI基础设施设计与部署实践
### 9.3 开源项目推荐
- [**DeepSeek**](https://github.com/DeepSeek-AI/DeepSeek): 一个基于Transformer的中文大模型,由上海人工智能实验室开发。
- [**unstructured**](https://github.com/Unstructured-IO/unstructured): Open source libraries and APIs to build custom preprocessing pipelines for labeling, training, or production machine learning pipelines.
- [**MinerU**](https://github.com/opendatalab/MinerU): A high-quality tool for convert PDF to Markdown and JSON.
- [**markitdown**](https://github.com/microsoft/markitdown): Python tool for converting files and office documents to Markdown.
- [**unsloth**](https://github.com/unslothai/unsloth): Finetune Llama 3.3, DeepSeek-R1 & Reasoning LLMs 2x faster with 70% less memory!
- [**ktransformers**](https://github.com/kvcache-ai/ktransformers): A Flexible Framework for Experiencing Cutting-edge LLM Inference Optimizations
---
## Buy Me a Coffee
如果您觉得本项目对您有帮助,欢迎购买我一杯咖啡,支持我继续创作和维护。
|**微信**|**支付宝**|
|---|---|
|
|
|