如何使用TensorFlow对可变化的目标进行强化学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24039
1. 如何得到能获得最大累积奖励的Q-learning? 2. 基于目标的强化学习的快递无人机场景是怎样的? 3. 如何使用TensorFlow进行Q-learning? 4. 如何直接预测未来? 5. 如何创造一个最优的奖励函数? 6. 如何改变目标? 7. 形式化目标搜索如何实现? 8. 如何训练我们的网络来预测期望的未来? 9. 如何制定更复杂的目标? 10. 如何用TensorFlow的异步实现? 11. 如何增强这一技术?
资源:写给人类机器学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24040
问答:
spark三种提交方式不同,造成错误原因排查
http://www.aboutyun.com/forum.php?mod=viewthread&tid=24037
|