About云-梭伦科技»专题 › 技术学习(版主发帖区) › 大数据学习 › Hbase › hbase与传统数据的区别

hbase与传统数据的区别

查看数: 87653 | 评论数: 24 | 收藏 5

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

hyj

发布时间: 2014-1-27 15:51

正文摘要:

本帖最后由 pig2 于 2014-4-4 23:49 编辑在说HBase之前，我想再唠叨几句。做互联网应用的哥们儿应该都清楚，互联网应用这东西，你没办法预测你的系统什么时候会被多少人访问，你面临的用户到底有多少，说不定今天 ...

zhouyongheng 发表于 2014-7-29 14:36:16

对hbase有了个大致的了解，非常感谢！

deveIT 发表于 2017-8-7 15:29:37

已收藏

xwm1999 发表于 2017-1-9 11:32:42

在Hbase里，如果每一个column 单元没有值，那么是占用空间的。下面我们通过两张图来形象的表示这种关系：

这句话是不是说错了，没有值不占用空间吧？

xrythy 发表于 2016-12-23 11:45:46

恩，是没有看见第二张图

jack_zhang 发表于 2016-7-21 10:53:26

Hbase是一个面向列存储的分布式存储系统，它的优点在于可以实现高性能的并发读写操作，同时Hbase还会对数据进行透明的切分，这样就使得存储本身具有了水平伸缩性。

jack_zhang 发表于 2016-7-21 10:52:45

首先刚开始，人不多，压力也不大,搞一台数据库服务器就搞定了，此时所有的东东都塞进一个Server里，包括web server,app server,db server,但是随着人越来越多，系统压力越来越多，这个时候可能你把web server,app server和db server分离了，好歹这样可以应付一阵子，但是随着用户量的不断增加，你会发现，数据库这哥们不行了，速度老慢了，有时候还会宕掉，所以这个时候，你得给数据库这哥们找几个伴，这个时候Master-Salve就出现了，这个时候有一个Master Server专门负责接收写操作，另外的几个Salve Server专门进行读取，这样Master这哥们终于不抱怨了，总算读写分离了，压力总算轻点了,这个时候其实主要是对读取操作进行了水平扩张，通过增加多个Salve来克服查询时CPU瓶颈。一般这样下来，你的系统可以应付一定的压力，但是随着用户数量的增多，压力的不断增加，你会发现Master server这哥们的写压力还是变的太大，没办法，这个时候怎么办呢？你就得切分啊，俗话说“只有切分了，才会有伸缩性嘛”，所以啊，这个时候只能分库了，这也是我们常说的数据库“垂直切分”，比如将一些不关联的数据存放到不同的库中，分开部署，这样终于可以带走一部分的读取和写入压力了，Master又可以轻松一点了，但是随着数据的不断增多，你的数据库表中的数据又变的非常的大，这样查询效率非常低，这个时候就需要进行“水平分区”了，比如通过将User表中的数据按照10W来划分，这样每张表不会超过10W了。

thomaschen 发表于 2016-3-7 16:08:03