搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
Cloudera系列
›
容量规划怎么做啊
0
3
0
分享
容量规划怎么做啊
grinsky
发表于 2016-11-14 14:47:10
[显示全部楼层]
阅读模式
关闭右栏
3
6690
About云VIP帮助找工作和提升
要弄个CDH集群,现有数据13T,日增量20G
主要做数据挖掘计算,这个要怎么去计算需要什么样的配置呢?
也搜了一些容量规划的文字,但都看的比较懵……
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
QIDOUDOU
发表于 2016-11-14 14:58:36
一般做这个规划, 需要考虑的几个内容:
13t的裸数据,按hdfs的存储,需要接近40t,每日增量20G,要考虑数据保留的周期和平台支撑到下次扩容的容量
考虑数据清洗需要的空间
考虑模型存储的空间
考虑计算所需要的空间
回复
使用道具
举报
显身卡
sstutu
发表于 2016-11-14 17:31:39
除了以上内容,其实还有软配置。比如人员的技能,维护能力,优化能力等。
回复
使用道具
举报
显身卡
醉半城
发表于 2016-11-15 10:01:10
good 。
回复
使用道具
举报
显身卡
还有一些帖子被系统自动隐藏,点此展开
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
最佳新人
积极上进,爱好学习
热心会员
经常帮助其他会员答疑
发表新帖
grinsky
高级会员
关注
50
主题
144
帖子
9
粉丝
TA的主题
kafka命令行工具卡住
2020-9-24
此 DataNode 未连接到其一个或多个 NameNode。
2019-12-12
sqoop导入数据问题求助
2018-11-28
spark2.3 java.lang.NoSuchMethodError: io.netty.buffer.PooledByteBufAllocator....
2018-4-28
hiveserver2自定义用户认证不生效
2018-2-11
24小时热文
Flink CDC:新一代实时数据集成框架
蚂蚁面试就是不一样
如何高效学习
人情世故速查速用大全集
框架思维
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈