60+ Implementations/tutorials of deep learning papers with side-by-side notes ; including transformers, optimizers, gans, reinforcement learning (ppo, dqn), capsnet, distillation, ...
最近更新: 24天前A self-contained course to learn the basics of neural networks: from backprop to GPT!
最近更新: 24天前本项目旨在以最直观的方式揭示现代 AI 框架(如 PyTorch)和强化学习环境(如 OpenAI Gym)背后的底层原理。它不依赖任何深度学习库,仅用约 300 行代码就实现了自动微分引擎、物理环境仿真以及神经网络训练。
最近更新: 25天前Systematic learning notes on Jason Wei's research, CoT, and LLM reasoning.(系统学习 Jason Wei 及其 LLM 推理研究的笔记)
最近更新: 1个月前A simplified, open-source implementation of the AlphaEvolve concept using the DeepSeek API. (一个使用DeepSeek API实现的简化版、开源的AlphaEvolve.) NanoAlphaEvolve 是 AlphaEvolve 方法论的一个 Python 实现,该方法论在论文《AlphaEvolve:
最近更新: 3个月前强化学习论文精读仓库:基于OpenAI Spinning Up关键论文清单,提供论文解析、笔记和代码实现,帮助深入理解强化学习核心算法与实战应用。
最近更新: 4个月前