💎一站式轻松地调用各大LLM模型接口,
支持GPT4、智谱、星火、月之暗面
及文生图
广告
UCB CS294-112 深度强化学习中文笔记
(1) 简介
(2) 模仿学习
(3) 增强学习简介
(4) 策略梯度法
(5) 演员-评论家算法
(6) 基于值函数的方法
(7) 深度增强学习中的 Q 学习方法
(8) 最优控制与规划
(9) 用数据拟合模型
(10) 基于模型的增强学习的策略训练
(11) 概率图模型与软化增强学习
(12) 逆增强学习