分享

OpenStack常识及常遇到问题解决

pig2 发表于 2014-2-11 17:18:22 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 6875
本帖最后由 pig2 于 2014-2-11 23:10 编辑

本文为解疑帖:
阅读本文章可以思考:
1.openstack有哪些网络模式,它们的区别是什么?
2.OpenStack中网络流向是怎样的?
思考:
3.OpenStack与传统软件有什么区别和联系?



一、网络问题-network
更多网络原理机制可以参考《OpenStack云平台的网络模式及其工作机制》。

1.1、控制节点与网络控制器区别

OpenStack平台中有两种类型的物理节点,控制节点和计算节点。控制节点包括网络控制、调度管理、api服务、存储卷管理、数据库管理、身份管理和镜像管理等,计算节点主要提供nova-compute服务。
控制节点的服务可以分开在多个节点,我们把提供nova-network服务的节点称为网络控制器。

1.2、OpenStack中nova-network的作用

OpenStack的网络由nova-network(网络控制器)管理,它会创建虚拟网络,使主机之间以及与外部网络互相访问。
OpenStack的API服务器通过消息队列分发nova-network提供的命令,这些命令之后会被nova-network处理,主要的操作有:分配ip地址、配置虚拟网络和通信。

1.3、OpenStack中Flat与FlatDHCP区别

Flat(扁平): 所有实例桥接到同一个虚拟网络,需要手动设置网桥。
FlatDHCP: 与Flat(扁平)管理模式类似,这种网络所有实例桥接到同一个虚拟网络,扁平拓扑。不同的是,正如名字的区别,实例的ip提供dhcp获取(nova-network节点提供dhcp服务),而且可以自动帮助建立网桥。

1.4、OpenStack中Flat与vLAN区别

在两种Flat模式里,网络控制器扮演默认网关的角色,实例都被分配了公共的IP地址(扁平式结构,都在一个桥接网络里)。
vLAN模式功能丰富,很适合提供给企业内部部署使用。但是,需要支持vLAN的switches来连接,而且相对比较复杂,在小范围实验中常采用FlatDHCP模式。

1.5、OpenStack中网络流向是怎样的,都经过网络控制器吗

多节点时,网络控制器与计算节点分别在不同主机,普通部署方式下(不是multi_host),只有nova-network控制网络,而它仅仅在控制节点运行。因此,所有计算节点的实例都需要通过控制节点来与外网通信。
可以通过multi_host等高可用性部署方式改变这个单点故障问题。

1.6、OpenStack单网卡怎么配置?

配置好服务器的网络(混杂模式);
/etc/nova/nova.conf那一块,public_interface和flat_interface都改成这个单网卡的名称即可,比如在脚本oneStack.sh 改动2处:
/etc/network/interfaces设置那一块,去掉第2个网卡的设置(eth1);
/etc/nova/nova.conf那一块,eth1修改为eht0(flat的网卡)。
这样,在这个网卡上,既有外网的网络,又有flat网络。详见《OpenStack云平台的网络模式及其工作机制》。

1.7、OpenStack中网络流向是怎样的,都经过网络控制器吗

多节点时,网络控制器与计算节点分别在不同主机,普通部署方式下(不是multi_host),只有nova-network控制网络,而它仅仅在控制节点运行。因此,所有计算节点的实例都需要通过控制节点来与外网通信。
可以通过multi_host等高可用性部署方式改变这个单点故障问题。

1.8、OpenStack中网络注意问题

1)openstack 中,nova-manage create用来创建虚拟机运行时所需的内网,并且将相关的IP地址记录到fixed_ips数据表中。但是,当调用nova-manage delete 时,并不会自动的删除fixed_ips中的内容,需手动进行删除。
2)采用FlatDHCP方式部署openstack,在开放了icmp和ssh22端口的情况下,仍然无法通过控制节点连接到虚拟机实例。此时应该检查控制节点的ip配置信息ip addr。
3)FlatDHCP模式下,network_size是整个fixed_ip range中的所有ip数。例如在一个A类/12的网络中,有2^20个IP地址,所有的这些IP地址都要写入数据库fixed_ips表中,这将会花费很长时间,导致出现假死。
4)如果采用FlatManager的网络模式,则必须手动建立相关的网桥,以便虚拟机实例之间以及和主机之间通信。
而且,必须手动的将虚拟机实例的内部IP加入到nova数据库的fixed_ips表中。
此外,fiexed_ips表保着所有可供虚拟机实例使用的内部IP,每次发起一个新的虚拟机实例,openstack的网络服务部分,根据 fixed_ips表中的内容分配给该实例IP。如果用户希望保留特定的IP地址,需要将数据库中该IP对应的reserved字段设置为1。

二、虚拟化问题-virtual

2.1、OpenStack中控制节点和计算节点配置nova.conf一样吗

多节点时,网络控制器与计算节点分别在不同主机,普通部署方式下(不是multi_host),只有nova-network控制网络,而它仅仅在控制节点运行。因此,所有计算节点的实例都需要通过控制节点来与外网通信。
可以通过multi_host等高可用性部署方式改变这个单点故障问题。
计算节点的nova.conf并不是与控制节点完全一样,主要是
--vncserver_proxyclient_address=
--vncserver_listen=
应该是计算节点的ip。

2.2、OpenStack执行 virsh -c qemu:///system list,一直挂起在那里(hang),怎么解决

killall -9 dmidecode
dmidecode是一个管理工具,在虚拟机装OpenStack中需要用到,用在libvirt中,但在有的机器中会出现hang up的情况,这时候需要kill掉它。

2.3、OpenStack中虚拟化技术在哪里配置

主要两个文件:nova.conf nova-compute.conf。
其中的虚拟技术应该一致,比如都为kvm,或者都为qemu。

2.4、OpenStack中虚拟机中nova-compute经常启动失败,virsh list显示空白,怎么解决

1. 在vmware workstation上的虚拟机需要修改 *.vmx文件
vcpu.hotadd = "TRUE"
变更为
vcpu.hotadd = "FALSE"
重新启动机器,如果执行命令:
virsh
进入控制台就没有问题了。
2. 修改nova配置文件/etc/nova/nova.conf
#--libvirt_type=kvm
更改为qemu
--libvirt_type=qemu
3. 修改/etc/nova/nova-compute.conf
--libvirt_type=qemu
4. 重新启动nova-compute,如果libvirt报错
/var/log/libvirt/libvirtd.log
Cannot find 'pm-is-supported' in path: No such file or directory
报错后需要安装
apt-get install pm-utils
2.5、noVNC不能连接到实例,提示“Connection Refuesd”,什么原因
可能是控制节点在收到vnc请求的时候,无法解析计算节点的主机名,从而无法和计算节点上的实例建立连接。
另外可能是,当前浏览器不支持或者不能访问,将计算节点的ip和主机名的对应关系加入到控制节点的/etc/hosts文件中。

三、存储、卷问题-volume、lvm

3.1、OpenStack中创建volume一直在creating,什么原因

主要因为nova-volume没有正常启动,可以
nova-manage service list
看看后面的状态,不是笑脸:-)而是xx。如果没有启动,请看下一条。

3.2、OpenStack中nova-volume服务不能启动,什么原因

主要因为没有nova-volumes卷组,或者iscsitarget服务没有启动(或者没有安装)。
1、vgdisplay
没有nova-volumes卷组,可以创建卷组和磁盘

  1. $ dd if=/dev/zero of=/opt/nova-volumes.img bs=1M seek=100000 count=0
  2. $ losetup -f /opt/nova-volumes.img
  3. $ losetup -a
  4. $ vgcreate nova-volumes /dev/loop0
复制代码
记着启动nova-volume然后创建volume,否则下面仍然不能创建

  1. $ service nova-volume restart
  2. $ nova volume-create --display_name "volume1" 10
复制代码
2、service iscsitarget status
1)没有安装iscsitarget,可以apt安装;
然后执行以下命令安装和设置为可以启

  1. apt-get install -y iscsitarget iscsitarget-dkms lvm2
  2. sed -i -e 's/false/true/' /etc/default/iscsitarget
  3. service iscsitarget start
  4. service nova-volume start
复制代码
2)状态为stop,可以start
  1. service iscsitarget start
复制代码
3)如果既没有nova-volumes卷组,也没有安装iscsitarget,切忌保证这两者都存在,然后重启nova-volume,再创建volume

有人安装iscsitarget并启动后就create,结果nova-volume并没有启动,所以问题依然存在;
有人创建nova-volumes,也没有重启nova-volume,也不能正常工作。

3.3、OpenStack中创建volume一直在creating,怎么停掉(stop)

主要因为nova-volume没有正常启动,可以
nova-manage service list
看看后面的状态,不是笑脸:-)而是xx。如果没有启动,请看下一条。

3.4、OpenStack中nova-volume执行出现问题,检查什么地方

主要因为nova-volume没有正常启动或者计算节点没有能找到target,可以检查以下这些问题。
nova-volume是否正常;控制点,详见问题3.2
iscsitarget是否开启;服务端
open-iscsi是否安装和开启;客户端
客户端(计算节点)iscsiadm discovery看看能不能找到存储服务;
分析nova-volume.log。

3.5、OpenStack中nova-volume管理target
控制节点查看target
tgtadm --lld iscsi --op show --mode target
建立target
sudo tgtadm --op new --lld=iscsi --mode=target --tid=1 --targetname=iqn.2010-10.org.openstack:volume-00000001

3.6、OpenStack中计算节点管理volume

查看session
sudo iscsiadm -m session
手动发现target
sudo iscsiadm -m discovery -t sendtargets -p IP:port
登入登出
sudo iscsiadm -m node -T targetname(iqn.2010-10.org.openstack:volume-00000004) -p 10.200.200.4:3260 --login
sudo iscsiadm -m node -T targetname(iqn.2010-10.org.openstack:volume-00000004) -p 10.200.200.4:3260 --logout
sudo iscsiadm -m node -o [delete|new|update] -T targetname

四、OneStack安装问题

4.1、OpenStack能在普通的PC机上跑吗?
普通pc没有试过,这也不是它需要支持的对象。但是普通pc一样可以工作的。
官网的配置,只是对于稍有一定规模的部署(配置并不算高,甚至是服务器最基本的要求)
现在服务器基本都64位,但是它也指出了,32位的可以工作的,只是不能运行64位的操作系统实例,自己改一下镜像就可以。还有不支持vt技术的,我没有试过。
双网卡也不是必须的,一个对内,一个对外。可以更改配置。详见1.6单网卡安装。
其它的基本就是自由的。

4.2、OneStack简单安装需要改哪些地方?

1、切换到root,oneStack.sh删除设置root密码、设置locale、设置apt这3段(为了方便刚安装新系统的用户加入的可选的步骤,setup_base.sh没有这3段)
2、设置ip等参数 OUT_IP 外网ip(注意这是相对于OpenStack?内部网络的) OUT_IP_PRE 外网ip前缀(脚本后面出现ip不用管,会被这个参数替换) FLOAT_IP 浮动ip
3、裸机的话qemu改成kvm (对于xen之类的未加入支持) VIRT_YPE
4、网络设置,会替换掉你原来的,不想替换就删掉这一段 设置cat写入interfaces文件(注意,那里面pre-up手动设置了网卡mac,不需要的自行去掉;单网卡去掉eth1的设置即可)
5、执行oneStack.sh 或者setup_base.sh(基本系统,没有添加镜像和实例,可以setup_test.sh)
其它没有需要更改的(数据库密码等自行更改无影响)。 里面有个image是从ubuntu官网下载,可能需要一些时间 (svn checkout,里面还有一些删除之类的工具)

4.3、OneStack单网卡安装需要改哪些地方?

除了4.2所述部分外
1)在配置interfaces时,去掉eth1部分;
2)后面nova.conf设置里面,eth1改为eth0(public_interface)。

4.4、OneStack多节点安装需要改哪些地方?

控制节点使用oneStack.sh,如果不需要安装nova-compute去掉即可;
计算节点执行addComputeNode.sh
注意nova.conf配置其余一样,只是
--vncserver_proxyclient_address=
--vncserver_listen=
应该是计算节点的ip。

4.5、OneStack安装后怎么清空nova数据,包括实例和volume等?

控制节点执行resetStack.sh clear,清空数据库;
再执行resetStack.sh重新初始化数据库。

五、镜像问题-image

5.1、OpenStack中可以使用windows吗

虚拟出来的实例基本与普通的主机一样,所以基本上所有系统都可以使用,制作相应的镜像即可。

5.2、OpenStack怎么制作Windows镜像

建立镜像文件
kvm-img create -f raw windowsxp.img 10G
启动安装到镜像
kvm -m 1024 -cdrom winxp.iso -drive file=windowsxp.img,if=virtio,boot=on -drive file=virtio-win-0.1-22.iso,media=cdrom -boot d -nographic -vnc :0
可以vnc查看以及操作安装过程
vncviewer 192.168.139.50:5900
(注意,5900最后一位与vnc :0对应,如果端口占用可以改为1、2、3等,vncviewer 5901等)
上传镜像
glance add name="WindowsXP" is_public=true container_format=ovf disk_format=raw < windowsxp.img

5.3、OpenStack怎么制作CentOS镜像

创建镜像
kvm-img create -f raw centos.img 5G
启动安装
kvm -m 2048 -cdrom CentOS-6.2-i386.iso -drive file=centos.img -boot d -net nic -nographic -vnc :1
操作安装过程
vncviewer 192.168.139.50:5901
再次启动安装好的镜像
kvm -m 2048 -drive file=centos.img -boot c -net nic -nographic -vnc :1
在虚拟机内部安装ssh,以便可以远程登录实例
yum install openssh-server
service sshd start (虚拟机内部)
chkconfig sshd on (不然,重启又不能ssh)
上传镜像
glance add name="CentOS6.2" is_public=true container_format=ovf disk_format=raw < centos.img
要使虚拟机内部访问外网,需要在节点上执行
sysctl -w net.ipv4.ip_forward=1
net.ipv4.ip_forward = 1 (vi /proc/sys/net/ipv4/ip_forward)

5.4、OpenStack怎么Linux登录ubuntu

官方提供的镜像需要使用密钥登录,也就是启动实例的时候使用的那个key(不用key启动ubuntu实例是没法ssh登录的)
ssh -i ~/.ssh/id_rsa ubuntu@10.0.0.2
在外网登录使用floating ip;
要访问外网注意设置节点上
sysctl -w net.ipv4.ip_forward=1
5.5、OpenStack怎么novnc浏览器访问登录ubuntu
在能使用vnc的地方,浏览器输入地址可以访问系统。
控制节点上
nova get-vnc-console 4 novnc
得到一个url,例如

  1. | Type | Url |
  2. | novnc | http://192.168.139.50:6080/vnc_auto.html?token=ca2455e8-fcc9-447f-92ee-853b92b37cdb |
复制代码
浏览器中使用这个url访问。

5.6、OpenStack怎么Windows登录ubuntu

下载启动实例的时候使用的那个key(不用key启动ubuntu实例是没法ssh登录的)
ssh登录工具里面选择key认证方式,auth里面上传这个private key
然后ssh登录,输入用户名ubuntu,直接登录。

5.7、OpenStack可以密码登录ubuntu而不是密钥吗

默认的镜像通过注入密钥的方式,ssh是需要密钥认证的方式登录,不允许密码登录的;
设置别的用户比如root密码后,在vnc里面可以通过密码登录;
可以自己制作镜像,参考制作CentOS镜像那样,使用密码登录。

六、实例问题-instance

6.1、OpenStack中实例是什么意思

简单的说,一个实例就是一个跑着操作系统的虚拟机。

6.2、OpenStack中实例怎么访问

在OpenStack内部,可以使用内网ip(fixed ip)访问。
外部,可以使用floating ip访问。
注意设置相应的访问规则,比如ssh端口,防火墙规则,ipv4_forward等。
可以vnc访问,vnc浏览器访问。
Linux系统可以ssh登录,桌面系统也可以安装xrdp实现远程桌面访问;
Windows系统可以远程桌面连接。

6.3、OpenStack中怎么管理实例

可以web端(dashboard)访问,图形化操作管理。也可以使用api,如下:
## 1:上传实例
  1. wget http://cloud-images.ubuntu.com/precise/current/precise-server-cloudimg-amd64-disk1.img
  2. glance add name="Ubuntu12.04-amd64" is_public=true container_format=ovf disk_format=qcow2
  3. < precise-server-cloudimg-amd64-disk1.img
复制代码
查看镜像
  1. nova image-list
复制代码
## 2:创建flavor
  1. nova flavor-list
  2. nova-manage flavor create --name=m1.minitest --memory=384 --cpu=1 --root_gb=1 --flavor=6 --ephemeral_gb=1
复制代码
## 3、创建虚拟机
  1. nova boot --flavor 1 --image "Ubuntu12.04-amd64" --key_name key1 cloud01
复制代码
查看实例
  1. nova show cloud01
复制代码
实例日志
  1. nova console-log cloud01
复制代码
##绑定浮动ip
  1. nova floating-ip-create
  2. nova add-floating-ip cloud01 192.168.139.226
  3. nova show cloud01
复制代码
或者直接
  1. nova add-floating-ip cloud01 `nova floating-ip-create | awk 'FNR==4{print $2}'`
  2. nova list
  3. nova show cloud01
复制代码
### 查看vm
  1. nova list
复制代码
### 删除vm,vm的ID或者名字
  1. nova delete 10d1bc19-b2c4-4eee-a5c8-b256bda3f343
  2. nova delete cloud01
复制代码
## 4、默认实例登录
  1. ssh-keygen -f "/home/cloud/.ssh/known_hosts" -R 10.0.0.2
  2. ssh -i ~/.ssh/id_rsa ubuntu@10.0.0.2
复制代码
6.4、怎么新建密钥,怎么使用密钥
  1. mkdir /root/ssh_clients/
复制代码
创建密钥:ssh-keygen -t rsa -f /root/ssh_clients/key01
上传密钥:nova keypair-add --pub_key /root/ssh_clients/key01.pub key01
启动实例时分配密钥:nova keypair-add --pub_key /root/ssh_clients/key01.pub key01
使用密钥登录:ssh -i /root/ssh_clients/key01 ubuntu@192.168.139.225
删除keypair:nova keypair-delete

6.5、OpenStack中nova-compute启动失败什么原因

分析/var/log/nova/nova-compute.log日志。
容易出现的问题是,volume问题或者virt问题。


6.6、OpenStack中无法连接实例
无法连接到虚拟机实例的时候,应该检查如下的环节:
1) 公共IP是否已经绑定到了公共网卡接口上,ip addr
2) 查看iptable的设置,NAT规则是否设置正确,iptables-save
3) 检查安全组设置,euca-describe-groups

6.7、OpenStack中实例注意问题

1)虚拟机在build阶段时,不要进行重启操作,否则会出现kernel panic现象。
nova-manage create用来创建虚拟机运行时所需的内网,并且将相关的IP地址记录到fixed_ips数据表中。但是,当调用nova-manage delete 时,并不会自动的删除fixed_ips中的内容,需手动进行删除。
2)计算节点的操作系统为32位,因此,kvm上启动的虚拟机内存受到限制,比如无法创建内存大于4G的虚拟机。
3)虚拟机实例已经绑定了浮动IP,并且控制节点的对外网络接口上也发现了相关的浮动IP地址,但是通过ssh却无法进行连接。
解决:在dashboard中添加相关的安全规则。security group -> edit rules
添加:icmp -1 -1 0/0;tcp 22 22 0/0
在OneStack里面,已经把端口全部启动1~65535,可以更改为只开放ssh、imcp等部分。
4)nova的配置文件默认存放在/etc/nova/nova.conf中,其中涉及到nova各个参数的配置。
nova所有的参数可以通过nova-api --help进行查看。

七、系统及其它

7.1、查看日志
OpenStack的nova相关日志都在/vr/log/nova下面,一般多数是nova出现问题,包括网络、存储、compute、虚拟化等。
volume相关问题查看nova-volume.log
compute和libvirt相关问题查看nova-compute.log
查看实例日志,web里面有这样一个菜单,api里面使用nova console-log cloud01


来自群组: openstack技术组

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条