分享

Spark有什么需要改进的问题和不足

小孩真笨 发表于 2016-9-20 18:21:45 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 3 13754
如题,目前在做毕业设计。导师想让我对Spark进行改进写写论文。求指教!

已有(3)人评论

跳转到指定楼层
tntzbzc 发表于 2016-9-20 18:45:06
主要还是内存问题
基于JVM的大数据程序都很难避开资源管理或者内存管理这个问题


回复

使用道具 举报

einhep 发表于 2016-9-20 18:46:04
目前Spark主要存在哪些缺点?
(a) JVM的内存overhead太大,1G的数据通常需要消耗5G的内存 -> Project Tungsten 正试图解决这个问题;
(b) 不同的spark app之间缺乏有效的共享内存机制 -> Project Tachyon 在试图引入分布式的内存管理,这样不同的spark app可以共享缓存的数据














知乎作者:Hugo Yang


回复

使用道具 举报

easthome001 发表于 2016-9-20 18:48:18
如果说优点很多,当然缺点也很多。只要你觉得麻烦,他就有缺点。
比如,最明显的当然是内存需要太多,花钱太多。
还有部署麻烦,能否一键安装。
运行过程中不要老是oom。
能否自动调优等等
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条