分享

求助!创建实例后无法启动

renjie 发表于 2016-4-25 14:08:27 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 7 9010
环境:openstack icehouse
有三个节点:
controller: keystone,glance, mysql, qpid, neutron-server, nova-api
network:  neutron-agent, openswitch
compute: nova-compute
创建m1.tiny 和m1.small都正常,分配好浮f动IP后还可以远程访问。
但是创建m1.medium后,首先是创建成功,但是随后状态就会变成shutdown。之后不管怎么启动都不行。请看附件。
keystone.log:
2016-04-25 13:45:20.149 2435 DEBUG keystone.middleware.core [-] RBAC: auth_context: {'is_delegated_auth': False, 'user_id': u'2ef32fd08b704f1d97db22ea839fa952', 'roles': [], 'trustee_id': None, 'trustor_id': None, 'trust_id': None} process_request /usr/lib/python2.6/site-packages/keystone/middleware/core.py:281
2016-04-25 13:45:20.150 2435 DEBUG keystone.common.wsgi [-] arg_dict: {} __call__ /usr/lib/python2.6/site-packages/keystone/common/wsgi.py:181
2016-04-25 13:45:20.162 2435 INFO eventlet.wsgi.server [-] 10.20.0.10 - - [25/Apr/2016 13:45:20] "GET /v2.0/tenants HTTP/1.1" 200 300 0.017359
2016-04-25 13:47:01.426 2435 DEBUG keystone.middleware.core [-] RBAC: auth_context: {'is_delegated_auth': False, 'user_id': u'2ef32fd08b704f1d97db22ea839fa952', 'roles': [u'_member_'], 'trustee_id': None, 'trustor_id': None, 'project_id': u'1e05979a369744cfae8349ea9a477dc4', 'trust_id': None} process_request /usr/lib/python2.6/site-packages/keystone/middleware/core.py:281
2016-04-25 13:47:01.428 2435 DEBUG keystone.common.wsgi [-] arg_dict: {} __call__ /usr/lib/python2.6/site-packages/keystone/common/wsgi.py:181
2016-04-25 13:47:01.458 2435 INFO eventlet.wsgi.server [-] 10.20.0.10 - - [25/Apr/2016 13:47:01] "POST /v2.0/tokens HTTP/1.1" 200 1471 0.035259
2016-04-25 13:47:01.464 2435 DEBUG keystone.common.authorization [-] RBAC: Proceeding without tenant v2_token_to_auth_context /usr/lib/python2.6/site-packages/keystone/common/authorization.py:124
2016-04-25 13:47:01.465 2435 DEBUG keystone.middleware.core [-] RBAC: auth_context: {'is_delegated_auth': False, 'user_id': u'2ef32fd08b704f1d97db22ea839fa952', 'roles': [], 'trustee_id': None, 'trustor_id': None, 'trust_id': None} process_request /usr/lib/python2.6/site-packages/keystone/middleware/core.py:281
2016-04-25 13:47:01.467 2435 DEBUG keystone.common.wsgi [-] arg_dict: {} __call__ /usr/lib/python2.6/site-packages/keystone/common/wsgi.py:181
2016-04-25 13:47:01.481 2435 INFO eventlet.wsgi.server [-] 10.20.0.10 - - [25/Apr/2016 13:47:01] "GET /v2.0/tenants HTTP/1.1" 200 300 0.021254

compute.log显示:
2016-04-25 13:37:33.531 2563 WARNING nova.virt.libvirt.imagecache [-] Unknown base file: /var/lib/nova/instances/_base/efe2cdbb914f63ef11db1b4e28912994059d679b
2016-04-25 13:42:03.437 2563 WARNING nova.virt.disk.vfs.guestfs [req-fc33d8db-de8d-4d08-80ee-7dbd512587bd 2ef32fd08b704f1d97db22ea839fa952 1e05979a369744cfae8349ea9a477dc4] Failed to close augeas aug_close: do_aug_close: you must call 'aug-init' first to initialize Augeas
2016-04-25 13:42:23.062 2563 WARNING nova.compute.manager [-] [instance: 293da75c-5310-4dab-b289-347414a6d5da] Instance shutdown by itself. Calling the stop API.
2016-04-25 13:45:32.644 2563 WARNING nova.compute.manager [-] [instance: 293da75c-5310-4dab-b289-347414a6d5da] Instance shutdown by itself. Calling the stop API.
2016-04-25 13:48:49.982 2563 WARNING nova.compute.manager [-] Found 3 in the database and 2 on the hypervisor.
2016-04-25 13:58:50.642 2563 WARNING nova.compute.manager [-] Found 3 in the database and 2 on the hypervisor.


个人猜测是资源分配上出现问题或是资源不够,因为创建资源较少的实例就正常,资源较多的实例就会出现问题。但是始终不知道怎么定位这个问题。
请帮忙看下
{9R$B3LYC[@$G7OCE5EGGNR.png






已有(7)人评论

跳转到指定楼层
leo_1989 发表于 2016-4-25 15:54:00
资源不够,这个属于Nova计算节点,所以需要查看Nova的日志,而不是keystone的日志
回复

使用道具 举报

renjie 发表于 2016-4-25 17:20:06
我清除日志后重新安装了一个实例,实例ID是8a08b4f6-b44c-4c56-9912-1f4e9414198a,我把日志都贴上来了。仔细看了日志,还是没有看出什么出错了,请高手帮忙看下。

log.zip

24.21 KB, 下载次数: 4

回复

使用道具 举报

leo_1989 发表于 2016-4-25 17:44:41
renjie 发表于 2016-4-25 17:20
我清除日志后重新安装了一个实例,实例ID是8a08b4f6-b44c-4c56-9912-1f4e9414198a,我把日志都贴上来了。仔 ...

看这个
/var/log/nova.log
和Nova相关的日志。
不过肯定是内存和和核数的问题
回复

使用道具 举报

renjie 发表于 2016-4-26 09:23:14
主机名字 类型 虚拟内核(总计)虚拟内核(已使用)内存(总计)内存(已使用)存储(总计)存储(已使用)       
compute0
        QEMU        16        0        78GB        512MB        836.0GB        0字节        0
compute1
        QEMU        16        0        39GB        512MB        442.0GB        0字节        0

内核16,内存39G,硬盘442G,资源较多啊
回复

使用道具 举报

renjie 发表于 2016-4-27 13:48:29
上面的问题还没有解决,现在又遇上了一个新的问题。自已做的镜像和网上下载的镜像都不能用于创建实例。我下载了CentOS-6-x86_64-GenericCloud-1508.qcow2,然后console上创建镜像。之后用这个镜像创建实例,分配浮动地址172.16.0.61,然后用SSH访问,一直访问不了。查看该实例的日志,发现以下内容:
Call Trace:
[<ffffffff8153d014>] oops_end+0xe4/0x100
[<ffffffff81010f5b>] die+0x5b/0x90
[<ffffffff8153c844>] do_trap+0xc4/0x160
[<ffffffff8100cf55>] do_invalid_op+0x95/0xb0
[<ffffffff8105553b>] ? _barrett+0xd/0x2f
[<ffffffff8100c01b>] invalid_op+0x1b/0x20
[<ffffffff8105553b>] ? _barrett+0xd/0x2f
[<ffffffff81055867>] ? __chksum_finup+0xf7/0x170
[<ffffffff81055912>] chksum_finup+0x12/0x20
[<ffffffff8125e63f>] crypto_shash_finup+0x1f/0x40
[<ffffffff8125e879>] shash_ahash_finup+0x49/0xa0
[<ffffffff8125e9ef>] shash_ahash_digest+0xef/0x110
[<ffffffff8125ea10>] ? shash_async_digest+0x0/0x30
[<ffffffff8125ea34>] shash_async_digest+0x24/0x30
[<ffffffff8125d748>] crypto_ahash_op+0x38/0xf0
[<ffffffff8125d816>] crypto_ahash_digest+0x16/0x20
[<ffffffff81260b84>] test_hash+0x1f4/0x620
[<ffffffff81177547>] ? cache_grow+0x217/0x320
[<ffffffff811785fc>] ? __kmalloc+0x21c/0x230
[<ffffffff81257585>] ? crypto_create_tfm+0x55/0xe0
[<ffffffff81260ff5>] alg_test_hash+0x45/0x80
[<ffffffff81260705>] alg_test+0xc5/0x350
[<ffffffff810672c2>] ? default_wake_function+0x12/0x20
[<ffffffff8125ec60>] ? cryptomgr_test+0x0/0x60
[<ffffffff8125ecae>] cryptomgr_test+0x4e/0x60
[<ffffffff810a0fce>] kthread+0x9e/0xc0
[<ffffffff8100c28a>] child_rip+0xa/0x20
[<ffffffff810a0f30>] ? kthread+0x0/0xc0
[<ffffffff8100c280>] ? child_rip+0x0/0x20
Code: e8 c0 46 d6 ff 48 8b 45 98 48 8d 5c 03 01 69 05 d5 ff 90 00 e8 03 00 00 48 98 48 39 d8 7f ca e8 51 07 b6 ff fb 66 0f 1f 44 00 00 <31> db e8 33 4b bb ff 48 89 df ff 15 aa ff 90 00 bf 58 89 41 00
RIP  [<ffffffff815382d6>] panic+0x14c/0x16f
RSP <ffff88007aaf37a8>
---[ end trace 93d72a36b9146f23 ]---
回复

使用道具 举报

renjie 发表于 2016-4-27 14:50:23
排查了原因,基本定位了问题:镜像的格式不对,icehouse无法解析,所以云主机无法正常启动。但是从哪里可以下载可以用的镜像呢?
回复

使用道具 举报

renjie 发表于 2016-5-25 10:12:15
后来安装了Openstack Juno,这个问题就不存在了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条