搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
Hive
›
hive该如何应对上亿的数据记录
0
3
0
分享
hive该如何应对上亿的数据记录
leletuo2012
发表于 2016-4-5 11:37:31
[显示全部楼层]
阅读模式
关闭右栏
3
11844
About云VIP帮助找工作和提升
现在有个表 其中单分区记录就达到50亿左右(一天的数据量),对该表进行简单的pv统计操作,发现集群的datanode会出现挂掉的情况(集群有5个datanode,最严重一次时全部挂掉了),该如何应对这种情况呢
记录
,
如何
,
统计
,
左右
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
相关帖子
.
问个关于如何直接给实例绑定外部IP的问题
.
ceilmeter如何推送数据至gnocchi
.
以HBase表作为MapReduce的输入,如何控制分片的大小,增加map task的数量
.
kafka的实际项目里面是如何push数据的
.
提交mapreduce job 进度到10%左右resourcesmanager进程就会挂掉,然后提示超时的错误
.
scala 输入指定的年月日判断这一天是一年的第几天,如何写代码
.
flume如何采集本地数据到kafka中? 遇到问题了
.
关于hive并发问题求助!!!
.
spark rdd如何做到terasort那样的快速排序
.
openstack开发在windows7下如何引入 keystoneclient.v2_0.client
已有(3)人评论
电梯直达
正序浏览
Alkaloid0515
发表于 2016-4-5 11:52:08
先分析下原因是什么?
先看看日志为什么会挂掉,然后对症下药。
比如内存不够了,或则集群调优下等。然后在想想改如何解决
回复
使用道具
举报
显身卡
jhon
发表于 2016-4-6 22:59:52
同上,是磁盘空间不够?楼主找到原因了吗?能总结一下出吗?
回复
使用道具
举报
显身卡
leletuo2012
发表于 2016-4-6 23:03:36
感觉不是,因为我只要把该任务干掉后不久,所有节点能自动恢复正常,目前原因仍在排查
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
leletuo2012
中级会员
关注
7
主题
84
帖子
3
粉丝
TA的主题
关于shipyard的不解问题
2017-12-22
到底是哪超时了
2016-7-6
hive 实现并发执行多任务
2016-5-20
hive该如何应对上亿的数据记录
2016-4-5
hive中自定义UDF函数如何使用外部文件
2016-3-25
24小时热文
Flink CDC:新一代实时数据集成框架
蚂蚁面试就是不一样
如何高效学习
人情世故速查速用大全集
框架思维
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈