摘要:
近日,Spark汇聚了所有人的目光,就连有着自己流式计算框架的Cloudera都宣布了对它的拥抱。但Cloudera同时称,Impala将会是交互式SQL on Hadoop的未来,该公司并不会用Spark代替Impala。
前段时间,Cloudera对比了Spark与Hadoop,取代MapReduce,宣布该公司将加大Spark的投入。实际上,Cloudera已经开始了向Spark的迁移,其中包括了所有Hive SQL-on-Hadoop的部分。同时,Cloudera称并不会使用Spark替换Impala,他们坚信Impala将是交互式SQL on Hadoop查询的未来,处理Hive的速度远超现有的所有软件。