做大数据系统,优化和部署对性能影响非常大,put的速度慢,可以从以下入手 1、是客户端的对文件系统的读出速度,这时起步; 2、看客户端与hadoop集群之间的带宽,客户端实际上是把数据直接分发到各个datanode的,网络带宽如果不够,那速度快不了,这时限制大数据的一个重要瓶颈。 3、集群上是否存在IO占用非常高的datanode; 以上三点是解决Put速度慢的方法, 其实各种IT问题都类似,解决思路也是类似。 |
看看评论 |
只看看 |
hadoop各个节点nameNode、dataNode之间都是通过rpc进行通信的,尽量保持每个节点都有足够的内存才能保持整个分布式系统的性能。 |
cwalet 发表于 2016-6-28 14:54 hadoop是分布式的,也可以说他们是一体的。 如果有的客户端慢,可能会影响速度的。他们之间是需要通信的,如果一台机器反映不过来,可能就会造成效率降低 |
本帖最后由 cwalet 于 2016-6-28 14:55 编辑 qcbb001 发表于 2016-6-28 14:38 目前所有datanode内存都是用满的,free:0 但是这跟节点内存有直接关系吗? namenode的内存只用了1/3,剩余40G,ls命令主要是受namenode影响吧?而且现在双namenode都不慢。 |
楼主先确保每个客户端的内存足够用。是否整台机器都慢。 |