文档详情 ID: cmp4sdil80p0o1o5smgk12uxr 后台管理 强化学习必修课:引领人工智能新时代 网盘资源 | 影盘社 file:1_1-1-课程内容和理念.mp4 file:3_9-3-演员评论家算法代码实现.mp4 file:1_8-1-策略梯度核心思想和原理.mp4 file:3_7-3-常见问题改进和扩展.mp4 file:5_11-5-AlphaStar系统.mp4 file:3_6-3-蒙特卡洛方法和时序差分代码实现.mp4 file:3_4-3-马尔可夫决策过程:试着-“干”.mp4 file:5_6-5-Q-Learning算法.mp4 file:4_12-4-下一步的学习建议.mp4 file:6_6-6-SARSA算法.mp4 file:3_2-3-概率.mp4 file:4_6-4-广义策略迭代.mp4 file:3_12-3-强化学习最新发展趋势.mp4 file:5_8-5-近端策略优化(PPO)代码实现.mp4 file:5_4-5-贝尔曼方程:迭代求解价值函数.mp4 file:1_12-1-项目实战:Gym游戏.mp4 folder:强化学习必修课:引领人工智能新时代 分享时间 2026-05-11 入库时间 2026-05-14 资源类型 夸克网盘 分享用户 Bl*ssoms 扫码获取资源 复制链接 进入网盘 分享资源