hochikong 发表于 2014-7-29 17:51:29

解决cinder-volume错误问题及NTP配置详解

本帖最后由 pig2 于 2014-7-29 18:02 编辑

问题导读:
1.cinder-volume提示错误的可能原因?
2.ntp如何正确配置?
3.ntp有哪些比较坑爹的细节?

http://www.aboutyun.com/data/attachment/album/201407/28/091850wutzhh9iublcxll7.gif


环境介绍:
ubuntu12.04,Havana三节点(controller,compute,cinder),使用nova-network,cinder节点使用LVM+tgt。

问题:

在dashboard上创建云硬盘,提示error。cinder service-list提示cinder-volume服务down了,但是登陆cinder节点,提示cinder-volume服务正运行。如图所示:



解决过程:首先检查了网络ping得通,如前文所述,cinder节点的volume服务正运行。重启了服务也不见解决。后来意外看到一篇blog,提到机器中时间不同步导致cinder创建云硬盘错误。分别在controller和cindernode上查看了下时间(命令:date),发现差了几分钟左右。以前我还以为直接把NTP装上去,再按照手册那样修改配置文件就能自动同步时间了。其实不然,NTP包包含作为客户端用的ntpdate和ntp守护进程,如果把某台服务器作为ntp服务器,把配置文件弄好就行。但是客户端不可以同时开着ntp守护进程的同时,用ntpdate去同步时间。客户机在同步时间前必须停掉ntp服务。

一下是一个比较可靠的ntp.conf配置:
restrict default nomodify notrap noquery
restrict 127.0.0.1
restrict 10.91.0.0 mask 255.255.255.0 nomodify
server 0.pool.ntp.org
server 1.pool.ntp.org
server 2.pool.ntp.org
server127.127.1.0   # local clock
fudge   127.127.1.0 stratum 10

driftfile /var/lib/ntp/drift
broadcastdelay0.008
keys            /etc/ntp/keys配置完成,重启一下服务。再从客户机使用命令同步时间
ntpdate SERVER_IP再重启服务,发现cinder-volume服务up起来了。也能正确创建云硬盘。

常见error:
1.ntpdate提示“the NTP socket is in use, exiting“:
解决:那是你的的ntp服务证在运行中,占用端口,停止服务即可:
service ntp stop2.ntpdate提示”no server suitable for synchronization found“(PS:如果不配置下面那行,可能要等五分钟左右才能正常,超过5分钟就应该检查是否配置正确了):
解决:一个原因是NTP server还没有和其自身或者它的server同步上。需要在配置文件中添加这么一行:
fudge 127.127.1.0 stratum 10意味着如果在/ntp.conf中定义的server都不可用时,将使用local时间作为ntp服务提供给ntp客户端。
还有其他很显著的原因,比如网络不通,服务没启动。。。

总结:

不熟悉NTP,本人就因此花了好几小时折腾。。。处理cinder-volume一下子搞定。总之,如果碰到cinder-volume down掉的错误,可以考虑一下是否因为时间不同步的问题咯。

参考文献及资料:
1.非常详细的NTP配置的资料(虽然对熟悉的人来说有点啰嗦),参见鸟哥的私房菜:
http://vbird.dic.ksu.edu.tw/linux_server/0440ntp.php
2.ntp.conf配置:
http://www.aboutyun.com/forum.php?mod=viewthread&tid=7719&highlight=ntp
3.参考的blog:
http://blog.scoke.org/openstack%E6%8E%92%E9%9A%9C-%E4%B8%8D%E8%83%BD%E5%88%9B%E5%BB%BA%E4%BA%91%E7%A3%81%E7%9B%98.html




CPJ1234 发表于 2014-10-14 18:56:10

楼主您好,我按照您的视频部署的,现在Cinder list的时候 其它都正常 但是所有的卷BOOTABLE都是FALSE的,而且卷不能附加到实例,一直都是正在添加没有用,请问一下有哪些原因啊

howtodown 发表于 2014-10-14 19:59:47

CPJ1234 发表于 2014-10-14 18:56
楼主您好,我按照您的视频部署的,现在Cinder list的时候 其它都正常 但是所有的卷BOOTABLE都是FALSE的,而 ...

看下日志

openstack排除查找错误的两种方法

CPJ1234 发表于 2014-10-16 20:44:05

howtodown 发表于 2014-10-14 19:59
看下日志

openstack排除查找错误的两种方法

您好 我又重装了一遍CINDER但还是有问题,我看了一下日志文件是这样的:
2014-10-16 20:33:57.432 990 INFO oslo.messaging._drivers.impl_rabbit Reconnecting to AMQP server on controller:5672
2014-10-16 20:33:57.433 990 INFO oslo.messaging._drivers.impl_rabbit Delaying reconnect for 1.0 seconds...
2014-10-16 20:33:58.440 990 INFO oslo.messaging._drivers.impl_rabbit Connected to AMQP server on controller:5672
2014-10-16 20:33:58.708 990 INFO oslo.messaging._drivers.impl_rabbit [-] Connected to AMQP server on controller:5672
2014-10-16 20:34:37.771 990 WARNING cinder.context [-] Arguments dropped when creating context: {'user': None, 'tenant': None, 'user_identity': u'- - - - -'}
2014-10-16 20:35:36.751 990 WARNING cinder.context [-] Arguments dropped when creating context: {'user': None, 'tenant': None, 'user_identity': u'- - - - -'}
2014-10-16 20:36:36.761 990 WARNING cinder.context [-] Arguments dropped when creating context: {'user': None, 'tenant': None, 'user_identity': u'- - - - -'}
2014-10-16 20:37:36.771 990 WARNING cinder.context [-] Arguments dropped when creating context: {'user': None, 'tenant': None, 'user_identity': u'- -

实在是看不出来啊,难道是环境变量的问题吗?我已经导入admin的环境变量了。。

slosh 发表于 2015-8-4 10:05:52

楼主,目前我云盘创建完毕挂载报错:
cinder.volume.targets.tgtFailed to create iscsi target for Volume ID: XXXX-XXXX-XXX. Please ensure your tgtd config file contains 'include /var/lib/cinder/volumes/*
'VolumeBackendAPIException: Bad or unexpected response from the storage volume backend API: Unable to create export for volume
是因为啥?在/etc/cinder/volumes/下没有生成相关tgt文件。。。

lilili 发表于 2015-11-17 12:15:09

请问楼主,我的cinder节点和controller节点是同一个,无法启动云硬盘,跟时间有关系吗?

栋哥哥丶 发表于 2016-8-28 20:24:42

非常感谢楼主    问题成功解决
页: [1]
查看完整版本: 解决cinder-volume错误问题及NTP配置详解