spark sql性能问题
有使用过sparksql 的吗?感觉性能如何我做了个测试spark sql很慢呀,impala和presto都是几秒出来,sparksql需要几十秒。
相对来讲 impala更快一些
这是英文版比较
https://amplab.cs.berkeley.edu/benchmark/
你们两个问题差不多
求Streaming查询hbase的方法
http://www.aboutyun.com/thread-16046-1-1.html
问题已解决。谢谢大家的回复,后来快了很多,但相比impala,presto还是要慢不少,我用的是spark on yarn,原来spark sql起的executor默认是1所以很慢。 楼主你好,请问你是怎么解决查询慢的问题的?你做过spark on yarn和standalone的查询对比吗?至于你说的executor默认为1好像是instance默认为1,但是我发现我把这个值改大后并行的tasks是多了,但每个task的执行时间变长了,总体执行时间差不多。
页:
[1]