基于Greenplum Hadoop 分布式平台的大数据解决方案
问题导读:1、什么是Greenplum?
2、如何理解Greenplum的架构?
3、Greenplum架构中Master Host、Segment、Interconnect分别是什么?
static/image/hrline/4.gif
Greenplum架构(1)
1、什么是Greenplum?
1)Greenplum历史
2)海量并行处理(Massively Parallel Processing) DBMS
3)基于PostgreSQL 8.2
a、相同的客户端功能。
b、增加支持并行处理的技术。
c、增加支持数据仓库和BI的特性。
外部表(external tables)/并行加载(parallel loading);
资源资源;
查询优化器增强(query optimizer enhancements)。
维护oracle的row,是一件很复杂的事情。
2、Greenplum体系架构;
Master Host相应Client端。Master Host将执行计划分发到每一个 Segment Host节点。
3、Master Host
1)访问系统的入口
2)数据库侦听进程(postgres)
3)处理所有用户连接
4)建立查询计划
5)协调工作处理过程
6)管理工具
7)系统目录表和元数据(数据字典)
8)不存放任何用户数据
4、Segment
1)每段(Segment)存放
2)一部分用户数据一个系统可以有多段
3)用户不能直接存取访问
4)所有对段的访问都经过Master
5)数据库坚挺进程(postgres)监听来自Master的连接
5、Interconnect
1)Greenplum数据库之间的连接层
2)进程间协调和管理
3)基于千兆以太网架构
4)属于系统内部私网配置
5)支持两种协议:TCPor UDP。 TCP:面向连接处理(3次握手)。建议使用UDP协议。非链接协议。
Greenplum架构(2)
1、网络配置示例。
2、Greenplum高可用性体系架构。
高可用行去配置镜像。
3、Master/Standby镜像保护
1)Standby节点用于当Master节点损坏是提供Master服务。
2)Standby实时与Master节点的Catalog和事务日志保持同步。通过synchronization process同步信息,primary master host和standby master host分别放在不同主机上。
4、数据冗余-Segment镜像保护
1)Standby节点用于当Master节点损坏是提供Master服务。
2)Standby实时与Master节点的Catalog和事务日志保持同步。
5、Segment主机硬件配置示例
6、网络冗余
about云小组群 基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
http: //pan. baidu. com/s/1pLRGiAR 密码: ad77
https:// yunpan. cn/Oc6RcCWXgWQRFT访问密码 0e03
您好.您发布的基于greenplum hadoop分布式平台大数据解决方案的百度网盘里的压缩包课件的解压密码是多少,您能告诉我吗?谢谢
页:
[1]