如何使用TensorFlow对可变化的目标进行强化学习

查看数: 13621 | 评论数: 2 | 收藏 1

关灯 | 提示：支持键盘翻页<-左右->

发布时间: 2018-3-8 13:30

本帖最后由 Oner 于 2018-3-8 13:35 编辑问题导读：1. 如何得到能获得最大累积奖励的Q-learning？2. 基于目标的强化学习的快递无人机场景是怎样的？3. 如何使用TensorFlow进行Q-learning？4. 如何直接预测未来？5 ...

jiangzi 发表于 2018-3-9 14:15:26

学习了，尽管不太懂~~~

Mr.k 发表于 2018-3-9 11:37:44

搬板凳来看看

图文精华