本帖最后由 pig2 于 2014-12-25 22:28 编辑
问题导读:
1、Hive将实现哪些关键特性?
2、Hive将获得哪些增强?
9月3日,Hortonworks 宣布开始下一阶段的工作,即Stinger.next,以便进一步扩展其功能及提升其性能。它将要实现的一些关键特性可以使Hive满足新的业务应用场景,包括:
- 支持ACID事务——用户将可以插入、更新和删除现有数据。Hive将由传统的一次写入、频繁读取的系统发展为一个支持变化数据分析的系统。
- 实现亚秒级查询——用户可以将Hive用于像交互式仪表板和探究性分析这样对响应时间有更高要求的应用场景。
- 全面支持SQL:2011 Analytics——用户可以使用标准SQL在Hive上部署复杂的报表,而且更快捷、更简便、更可靠。而基于成本的、功能强大的优化器可以确保工具生成的查询和复杂查询的运行速度。届时,Hive将在Hadoop上提供企业级SQL用户所享有的全部表达能力。它将在支持窗口函数、用户自定义函数、子查询、Rollup、Cube、标准聚集、内连接、外连接、半连接和交叉连接的基础上,增加对不等连接、集合函数(并、交、差)、时间间隔类型等的支持。
Stinger.next计划用时18个月,将分三个阶段交付。事务支持将于2014年底发布,亚秒级查询将在2015年上半年推出,而对SQL:2011 Analytics的全面支持则将于2015年底完成。
此外,Hive还将与机器学习框架Spark集成,使用户可以通过Hive运行机器学习模型。除了上述特性外,Hive还将获得如下增强: - Hive Streaming Ingest将帮助用户基于最新数据扩展运营报表;
- Hive Cross-Geo Query使用户可以在分布式数据集上查询和生成报表;
- 物化视图使用户可以存储相同数据的多个视图;
- 改进可用性;
- 简化部署过程。
另一方面,Hortonworks声称,他们的关键合作伙伴,如Microsoft、Informatica、Microstrategy和Tableau都将加入Stinger.next计划。Hortonworks将继续在速度、规模和SQL语义方面对Hive进行扩展。
|