实战毁灭战士基础环境—AI算法与游戏详解_码力舰长

第一章初始强化学习算法

第二章 AI算法案例

实战井字棋游戏—AI算法与游戏详解

时长:25分44秒

多臂赌徒问题(上)—AI算法与游戏详解

时长:19分6秒

多臂赌徒问题(下)—AI算法与游戏详解

时长:19分20秒

实战多臂赌徒游戏—AI算法与游戏详解

时长:12分48秒

如何优雅的计算Q值—AI算法与游戏详解

时长:13分34秒

有限马尔可夫决策过程—AI算法与游戏详解

时长:22分6秒

格子世界游戏实验—AI算法与游戏详解

时长:18分13秒

游戏中的价值函数—AI算法与游戏详解

时长:23分27秒

动态规划—AI算法与游戏详解

时长:28分46秒

实战新格子世界—AI算法与游戏详解

时长:10分52秒

实战汽车租赁游戏—AI算法与游戏详解

时长:26分45秒

实战踏冰寻宝游戏—AI算法与游戏详解

时长:26分45秒

初始蒙特卡罗方法—AI算法与游戏详解

时长:20分3秒

实战黑杰克游戏—AI算法与游戏详解

时长:29分19秒

折扣奖励问题—AI算法与游戏详解

时长:12分51秒

蒙特卡罗控制—AI算法与游戏详解

时长:17分59秒

在线策略与离线策略—AI算法与游戏详解

时长:19分6秒

时间差分方法—AI算法与游戏详解

时长:16分2秒

时间差分控制算法—AI算法与游戏详解

时长:23分14秒

实战攀登者游戏—AI算法与游戏详解

时长:13分19秒

攀登者答案讲解与双Q算法—AI算法与游戏详解

时长:15分14秒

多步自举算法—AI算法与游戏详解

多步自举控制方法—AI算法与游戏详解

时长:16分51秒

实战出租车项目挑战—AI算法与游戏详解

时长:15分33秒

离散环境的规划与学习—AI算法与游戏详解

时长:18分49秒

如何让AI拥有基本的记忆力—AI算法与游戏详解

时长:21分6秒

实战规划与学习迷宫—AI算法与游戏详解

时长:18分6秒

实战移动迷宫—AI算法与游戏详解

时长:7分24秒

深度强化学习基础之在线学习值估计—AI算法与游戏详解

时长:23分55秒

线性模型值估计方法—AI算法与游戏详解

时长:20分8秒

最速神经网络复习—AI算法与游戏详解

时长:23分58秒

实战平衡杆游戏（简单版）—AI算法与游戏详解

时长:22分57秒

DQN—AI算法与游戏详解

时长:22分3秒

实战平衡杆游戏（困难版）—AI算法与游戏详解

时长:22分24秒

实战爬山车游戏（简单版）—AI算法与游戏详解

时长:28分47秒

实战爬山车游戏（困难版）—AI算法与游戏详解

时长:7分56秒

实战太空侵略者—AI算法与游戏详解

时长:24分36秒

实战毁灭战士基础环境—AI算法与游戏详解

时长:21分14秒

双重DQN与记忆优先—AI算法与游戏详解

时长:12分34秒

实战FlappyBird—AI算法与游戏详解

时长:23分14秒

对决网络—AI算法与游戏详解

时长:15分55秒

实战死亡回廊—AI算法与游戏详解

时长:11分28秒

死亡回廊基本解—AI算法与游戏详解

时长:5分27秒

基于策略的学习—AI算法与游戏详解

时长:19分51秒

异步强化学习—AI算法与游戏详解

时长:14分58秒

第三章工具介绍

好用的Baselines3工具—AI算法与游戏详解

时长:25分31秒

第四章课程总结

免费看课（注册即享)

点击立刻注册/登录

意见
反馈

联系
客服

回到
顶部

注册即送7天全站VIP!

全站0套，共0课，0个就业班，免费畅学