学习大数据、云技术如何提高部署学习效率

问题导读

1.如何避免反复部署集群？
2.快照的作用是什么？
3.缓存服务器能起到什么作用？

学习大数据、云技术，我们首先应该掌握的是部署，通过部署，我们认识hadoop、openstack等大数据、云技术。
所以部署是我们入门的第一步。
在我们学习的过程中，部署异常是经常遇到的问题，当然如果比较喜欢专研或则非要找出哪里出错了，此文不要适合，本人适合人群，对于错误，无法找到，或则部署混乱，不得不重新部署。这里交给大家，如何最大限度的提高效率。

1.虚拟机快照

来源：
使用虚拟机搭建hadoop、openstack集群必备基础知识：虚拟机快照

我们刚从零基础知识学会搭建集群，学会了Linux知识，学会了Java基础。然后我们开始搭建集群。
搭建hadoop集群
搭建hbase集群
搭建storm
搭建spark集群

在搭建集群的过程中，遇到了各种问题，然后不断的重复开始，不断重复搭建，废了很长时间搭建快要成功的时候，前面都正确安装，但是因为某一个操作，却把环境搞坏了。比如hadoop搭建成功，hbase却失败了。但是又找不出原因。Java环境配置正确了，却因为ssh不成功，然后不断的修改。坏境坏了，该如何办？
如果我们刚开始学习，会不断的重复搭建环境，然后花费大量的时间，在搭建集群上，那么有没有更好的办法。答案是有的，就是----创建虚拟机快照。

那么该具体如何操作：

首先我们看到1处虚拟机，右键弹出右侧菜单，然后看到快照。

3.拍摄快照
点击拍摄快照后，弹出下图，输入名称，快照就做好了。如果后面配置遇到问题，恢复快照即可。

4.恢复到快照
上面做好了快照，这里就可以恢复到某个快照了。

5.快照管理器
单击快照管理，就看到了备份的快照，如果备份了多个就能看到多个。可以恢复到任意一个备份的快照

以上有的朋友可能也知道的，但是合理的使用快照，可以提高搭建集群的效率

2.搭建缓存服务器

这里以ubuntu14.04为例：

源服务器名称可能不太准确，意思是创建内网自己的私服，这样只要有Ubuntu通过该私服下载安装过软件，私服都会缓存，下一个Ubuntu的请求就直接从缓存中获取。

首先安装apt-cacher

apt-get install apt-cacher  
复制代码

装的过程中选择Daemon方式。
装完后，/etc/default/apt-cacher 文件内容应该如下：

AUTOSTART=1  
复制代码

所以服务应该已经启动了。
到/etc/apt-cacher/apt-cacher.conf文件中修改一行配置，允许任何客户端访问：

allowed_hosts = *  
复制代码

重启服务

service apt-cacher restart
复制代码

然后打开网页：http://your_ip:3142/apt-cacher
看到页面就说明服务器正常启动了。

在/etc/hosts文件中添加一行，可以帮助找到chrome依赖的dl.google.com

203.208.45.206 dl.google.com
复制代码

在客户端的ubuntu机器上，创建文件 /etc/apt/apt.conf文件或者/etc/apt/apt.conf.d/01proxy文件

内容如下：

Acquire::http::Proxy "http://your_server:3142";
复制代码

然后运行apt-get update, 为了确认真的起作用。可以查看apt-cacher的日志，到服务器上查看目录下的日志文件

/var/log/apt-cacher

这里以openstack为例：

服务器ip地址为10.0.0.100：

客户端配置：

在客户端的ubuntu机器上，创建文件 /etc/apt/apt.conf文件或者/etc/apt/apt.conf.d/01proxy文件

内容如下：
[mw_shl_code=bash,true]Acquire::http::Proxy "http://10.0.0.100:3142";[/mw_shl_code]

然后运行apt-get update, 为了确认真的起作用。可以查看apt-cacher的日志，到服务器上查看目录下的日志文件

/var/log/apt-cacher

监控：

yangelar · 发表于 2015-8-2 10:15:26

多谢多谢

图文精华

学习大数据、云技术如何提高部署学习效率

已有(1)人评论

活跃会员

热心会员

优秀版主

论坛元老

推荐 /2