本课程主要介绍强化学习的基础知识,其目标是帮助同学们快速、顺利地进入强化学习及其应用领域的研究工作。课程主要内容包含有限马尔可夫决策过程,动态规划,无模型预测与控制(SASA,Q-Learning),价值函数逼近(DQN),策略梯度方法(REINFORCE),执行者/评论者方法(AC,TRPO,PPO),连续动作空间的确定性策略(DDPG)。
最近更新: 12个月前异步串口通信的串口库,速度优。支持多窗口,自定义自动发送指令、侧边栏快捷指令、日志分文件存储、循环发送指令等
最近更新: 12个月前StackForce 双足轮机器人开源套件 持续更新 群号 223211857
最近更新: 1年多前超过1000本的计算机经典书籍、个人笔记资料以及本人在各平台发表文章中所涉及的资源等。书籍资源包括C/C++、Java、Python、Go语言、数据结构与算法、操作系统、后端架构、计算机系统知识、数据库、计算机网络、设计模式、前端、汇编以及校招社招各种面经~
最近更新: 1年多前:books: 免费的计算机编程类中文书籍,欢迎投稿
最近更新: 1年多前一个新型结构的轮腿机器人开源资料,包含机械设计、电子设计、算法仿真、软件开发等材料
最近更新: 1年多前stm32 and freeRTOS learning and codes
最近更新: 1年多前达妙科技开源四足仓,使用4个DM4310 两个DM60轮毂 一个DM-MC02开发板,结构件可以使用3D打印件,也可以使用开源的机加件。交流群号:461175473
最近更新: 1年多前