文档详情 ID: cmptzqumjdl4vav5sr4hy46vy 后台管理 强化学习必修课:引领人工智能新时代 网盘资源 | 影盘社 file:2_4-2-马尔可夫观测过程:学会“看”.mp4 file:3_6-3-蒙特卡洛方法和时序差分代码实现.mp4 file:3_2-3-概率.mp4 file:2_10-2-Dyna-Q算法.mp4 file:2_9-2-改进型演员评论家算法.mp4 file:1_7-1-深度Q网络核心思想和原理.mp4 file:6_6-6-SARSA算法.mp4 file:6_11-6-基于人类反馈大强化学习.mp4 file:2_8-2-蒙特卡洛策略梯度.mp4 file:3_12-3-强化学习最新发展趋势.mp4 file:5_6-5-Q-Learning算法.mp4 file:5_10-5-MBPO的代码实现.mp4 file:5_3-5-深度学习库PyTorch的安装.mp4 file:5_4-5-贝尔曼方程:迭代求解价值函数.mp4 file:2_12-2-项目实战:大模型RLHF.mp4 file:4_3-4-仿真环境Gym安装.mp4 folder:强化学习必修课:引领人工智能新时代 分享时间 2026-05-29 入库时间 2026-05-31 资源类型 夸克网盘 分享用户 奔跑*香蕉 扫码获取资源 复制链接 进入网盘 分享资源