学习了 |
提交在哪 任务在哪跑 数据在哪 这几个关系分清楚 |
SuperDove 发表于 2017-2-22 18:45 这个跟在哪提交没有关系的。 关键是任务分配在什么地方,跑任务的地方跟数据的关系。 而不是在哪提交,任务就跑在哪台机器。所以关键还是跑任务与数据的机器是否一台。 楼主有一个错误的认识,就是我在那台机器上提交,任务就会跑在哪台。其实你在哪提交是无所谓的事情。 所以还是需要从配置入手。将数据本地化,也就是任何和数据同时在一台机器上。 |
其实说白了,就是楼主的数据和跑任务的节点不在一个节点上,导致任务的输入数据要跑到别的节点上取数据 |
其实这个代表task 的计算节点和 task 的输入数据的节点位置关系
|