Cloudera Impala 直接对您存储在 HDFS 或 HBase 中的 Apache Hadoop 数据提供快速、交互式 SQL 查询。除了使用相同统一存储平台之外,Impala 也使用与 Apache Hive 相同的元数据、SQL 语法 (Hive SQL)、ODBC 驱动程序和用户界面(Hive 中的 Cloudera Impala 查询用户界面)。这为实时或面向批处理的查询提供一个熟悉且统一的平台。
Cloudera Impala 是增加的可用于查询大数据的工具的。Impala 不能替代基于 MapReduce 构建的批处理框架(如 Hive)。Hive 和其他基于 MapReduce 构建的框架最适合于长时间运行的批处理作业,例如涉及提取、转换和加载 (ETL) 类型作业的批处理的那些批处理作业。
Impala 提供:
下图展示了如何在更广泛的 Cloudera 环境下定位 Impala: