文档详情 ID: cmjq9bb3j01tmbb88v0um0n4x 后台管理 强化学习必修课:引领人工智能新时代 网盘资源 | 影盘社 file:2_9-2-改进型演员评论家算法.mp4 file:6_4-6-模型分类与选择.mp4 file:3_7-3-常见问题改进和扩展.mp4 file:4_8-4-近端策略优化算法.mp4 file:1_8-1-策略梯度核心思想和原理.mp4 file:5_4-5-贝尔曼方程:迭代求解价值函数.mp4 file:4_11-4-MADDP的代码实现.mp4 file:3_2-3-概率.mp4 file:7_6-7-Q-Learning&SARSA代码实现.mp4 file:2_4-2-马尔可夫观测过程:学会“看”.mp4 file:2_1-2-认识强化学习.mp4 file:5_11-5-AlphaStar系统.mp4 file:2_3-2-conda使用命令.mp4 file:2_12-2-项目实战:大模型RLHF.mp4 file:1_6-1-蒙特卡洛方法.mp4 folder:强化学习必修课:引领人工智能新时代 分享时间 2025-07-27 入库时间 2025-12-28 资源类型 夸克网盘 分享用户 夸父*011 扫码获取资源 复制链接 进入网盘 分享资源