# deep-learning-notes **Repository Path**: jshn9515/deep-learning-notes ## Basic Information - **Project Name**: deep-learning-notes - **Description**: Personal deep learning study notes and tutorial-style notebooks - **Primary Language**: Python - **License**: Not specified - **Default Branch**: main - **Homepage**: https://jshn9515.github.io/deep-learning-notes/ - **GVP Project**: No ## Statistics - **Stars**: 4 - **Forks**: 1 - **Created**: 2026-04-18 - **Last Updated**: 2026-06-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: 深度学习, PyTorch, 教程 ## README # 深度学习笔记 [![publish](https://github.com/jshn9515/deep-learning-notes/actions/workflows/quarto-publish.yml/badge.svg)](https://github.com/jshn9515/deep-learning-notes/actions/workflows/publish.yml) [![build](https://github.com/jshn9515/deep-learning-notes/actions/workflows/dnnlpy-ci.yml/badge.svg)](https://github.com/jshn9515/deep-learning-notes/actions/workflows/dnnlpy-ci.yml) [![Python](https://img.shields.io/badge/Python-3.14-blue)](https://www.python.org/) [![PyTorch](https://img.shields.io/badge/PyTorch-2.12.0-ee4c2c?logo=pytorch)](https://pytorch.org/) [![Transformers](https://img.shields.io/badge/Transformers-5.12.0-ffcc00?logo=huggingface)](https://huggingface.co/docs/transformers/index) [English](README.md) | **简体中文** ![dnnl-title](assets/dnnl-title.png) 关于怎么学深度学习,我困扰了很久。 《动手学深度学习》是很好的入门书,但更新速度已经有些跟不上这个领域的发展。Transformer 之后,CLIP、Diffusion、vLLM 等等内容越来越多,网上资料虽然丰富,却很零散,今天看 Attention,明天学 LoRA,后天又去读扩散模型,最后留下的往往只是碎片,很难真正串成体系。 所以我想,干脆把自己学过的内容系统地整理下来。从最基础的 PyTorch,到 Attention、Transformer,再到 GAN、CLIP、Stable Diffusion、SAM3,我会尽量把每个主题的核心思想、公式推导、代码实现和常见问题都写清楚。这个仓库就是这份笔记的公开版。如果你也在自学深度学习,希望它能给你一些帮助。 ## 📌 关于这份笔记 本项目目前主要使用 **Quarto Markdown** 进行维护和发布,并构建为静态网站。Quarto Markdown 是一种基于 Markdown 的纯文本格式,适合版本控制和持续更新。 内容主要包括: - PyTorch 核心与工程实践 - 注意力机制与 Transformer 系列模型 - 生成模型,如 GAN、VAE、Diffusion - 多模态模型,如 CLIP 等 - Hugging Face 生态与实际应用 - 从数据处理到训练、推理、部署的实践笔记 项目对应的 Jupyter Notebook 版本在 [jshn9515/dnnl-notebooks](https://github.com/jshn9515/dnnl-notebooks)。这个仓库会与主仓库保持同步,其中的 notebooks 可以直接在 Google Colab 中打开。GitHub Actions Artifacts 也可以作为备用来源,在仓库同步失败或暂时不可用时,用于获取最新的构建输出。 如果你希望自己从源码生成 Notebook,也可以在本地安装 Quarto 后,使用 `quarto convert` 命令将 `.qmd` 文件转换为 Jupyter Notebook。例如: ```bash quarto convert path/to/file.qmd ``` ## 🔧 环境配置 本仓库所有代码已在以下环境测试通过: - Python 3.14 - PyTorch 2.12 完整依赖见 `requirements.txt`。 在运行相关内容之前,请先安装 `dnnlpy` 库。这个库包含了笔记中使用的一些自定义实现和工具函数,安装完成后才能正常运行相关代码。 ```bash pip install dnnlpy ``` 如果你想直接从本仓库安装最新版本,可以使用: ```bash uv pip install "git+https://github.com/jshn9515/deep-learning-notes.git#subdirectory=dnnlpy" ``` > [!NOTE] > 本项目使用 **Transformers v5**。如果你参考的其他仓库或教程基于 v4,API 会有较大差异(如分词器、量化配置等),请参考 [官方迁移指南](https://github.com/huggingface/transformers/blob/main/MIGRATION_GUIDE_V5.md) 进行调整。 ## 🤝 贡献 如果你发现某个概念解释得不够清楚、某段代码有问题,或者有你希望我补充的主题,欢迎通过 Issue 或 Pull Request 参与改进。 你可以贡献的内容包括但不限于: - 指出笔记中的错误或不准确之处 - 补充更清晰的解释、公式推导或代码注释 - 提出排版、结构或表达上的改进建议 - 建议我后续补充的主题或案例 由于这是我在自学过程中持续整理的项目,难免会有理解不到位或表述不够准确的地方。所有有帮助的反馈,我都会认真阅读并尽量及时改进。 如果你想提交较大的修改,建议先开一个 Issue 简单说明想法,方便提前沟通。 ## 🙏 致谢 在整理这些笔记的过程中,我参考了不少优秀的资源。尤其是李沐老师的《动手学深度学习》和李宏毅教授的深度学习系列课程,对我理解深度学习中的许多核心概念帮助很大。 本项目网站使用 [Quarto](https://quarto.org/) 搭建。 ## 📄 许可证 - 本仓库中的笔记内容采用 **CC BY-NC 4.0 协议**。 - `dnnlpy` 库采用 **MIT 协议**。 ## ⭐ Star History [![Star History Chart](https://api.star-history.com/chart?repos=jshn9515/deep-learning-notes&type=date&legend=top-left)](https://www.star-history.com/?repos=jshn9515%2Fdeep-learning-notes&type=date&legend=top-left)