分享

openstack创建instance的流程及API介绍

pig2 发表于 2014-2-10 18:29:49 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 3 12182
本帖最后由 pig2 于 2014-2-10 19:18 编辑

阅读本文章可以带着下面问题:

1.用户请求发送nova-api有几种方式?分别是什么?
2.由哪个进程直接产生instance?


综述
启动一个新的instance涉及到很多openstack nova里面的组件
  • API server:处理客户端的请求,并且转发到cloud control
  • Cloud control:处理compute节点,网络控制节点,API server和scheduler中间连接
  • Scheduler:选择一个host去执行命令
  • compute worker:启动和停止实例,附加和删除卷 等操作
  • network controller:管理网络资源,分配固定IP,配置vlans
1.png


  1.API server将消息发送到Cloud Controller
  2. Authertication 保用户有权限,然后Cloud Controller将消息发送给Scheduler
  3. Scheduler caste 一个消息给一个选择好的host要求他启动一个实例
  4.compute worker(选择的那个host)获取到消息
  5.6.7.8 compute worker需要一个固定的ip去启动一个实例,所以向network controller发送消息


下面我将详细说明一下:


API

1.可以在dashboard网页上面进行
2.可以用命令行 euca-add-keypair        euca-run-instances

  用户的请求发送到nova-api,有两种方式
  第一种:通过openstack api (nova/api/servers.py 类 class Controller(object))create方法
    def create(self, req, body):
        """ Creates a new server for a given user """
        if 'server' in body:
            body['server']['key_name'] = self._get_key_name(req, body)

        extra_values = None
        extra_values, instances = self.helper.create_instance(
                req, body, self.compute_api.create)


  第二种:通过ec2 api (nova/api/cloud.py 中类 CloudController )
  调用def run_instances(self, context, **kwargs):
        ...
        (instances, resv_id) = self.compute_api.create(context,
            instance_type=instance_types.get_instance_type_by_name(
                kwargs.get('instance_type', None)),
        ...


最终调用的Compute API create():


  • 查看这种类型的instance是否达到最大值
  • 如果不存在安全组,就创建个
  • 生成MAC地址和hostnames
  • 给scheduler发送一个消息去运行这个实例



CAST

当然maxCount为1(默认值为1)的时候 调用RPC.cast方法向scheduler发送运行实例的消息

2.png


在openstack中通过RPC.cast来发送消息,消息的分发通过RabbitMQ。消息发送方(Compute API)往
topic exchange(scheduler topic)发送一个消息,消息消费者(Scheduler worker)从队列中获得消息,
cast调用不需要返回值。
  1. def _schedule_run_instance(self,
  2.         ...
  3.         return rpc_method(context,
  4.                 FLAGS.scheduler_topic,
  5.                 {"method": "run_instance",
  6.                  "args": {"topic": FLAGS.compute_topic,
  7.                           "request_spec": request_spec,
  8.                           "admin_password": admin_password,
  9.                           "injected_files": injected_files,
  10.                           "requested_networks": requested_networks,
  11.                           "is_first_time": True,
  12.                           "filter_properties": filter_properties}})
复制代码
Scheduler

scheduler接收到消息,然后通过设定的scheduler策略选择一个目的host,如:zone scheduler
选择一个主机在特定的可获取的zone上面。最后发送一个cast消息到特定的host上面
  1. def cast_to_compute_host(context, host, method, update_db=True, **kwargs):
  2.     """Cast request to a compute host queue"""
  3.     if update_db:
  4.         # fall back on the id if the uuid is not present
  5.         instance_id = kwargs.get('instance_id', None)
  6.         instance_uuid = kwargs.get('instance_uuid', instance_id)
  7.         if instance_uuid is not None:
  8.             now = utils.utcnow()
  9.             db.instance_update(context, instance_uuid,
  10.                     {'host': host, 'scheduled_at': now})
  11.     rpc.cast(context,
  12.             db.queue_get_for(context, 'compute', host),
  13.             {"method": method, "args": kwargs})
  14.     LOG.debug(_("Casted '%(method)s' to compute '%(host)s'") % locals())
复制代码
Compute
compute worker进程接收到消息执行方法(nova/compute/manager.py)
  1. def _run_instance(self, context, instance_uuid,
  2.                       requested_networks=None,
  3.                       injected_files=[],
  4.                       admin_password=None,
  5.                       is_first_time=False,
  6.                       **kwargs):
  7.         """Launch a new instance with specified options."""
  8.         context = context.elevated()
  9.         try:
  10.             instance = self.db.instance_get_by_uuid(context, instance_uuid)
  11.             self._check_instance_not_already_created(context, instance)
  12.             image_meta = self._check_image_size(context, instance)
  13.             self._start_building(context, instance)
  14.             self._notify_about_instance_usage(instance, "create.start")
  15.             network_info = self._allocate_network(context, instance,
  16.                                                   requested_networks)
  17.             try:
  18.                 block_device_info = self._prep_block_device(context, instance)
  19.                 instance = self._spawn(context, instance, image_meta,
  20.                                        network_info, block_device_info,
  21.                                        injected_files, admin_password)
  22.         ...
复制代码
  • 检查instance是否已经在运行
  • 分配一个固定的ip地址
  • 如果没有设置vlan和网桥,设置一下
  • 最后通过虚拟化的driver spawn一个instance

network controller

network_info = self._allocate_network(context, instance,
                                                  requested_networks)

调用network的API的allocate_for_instance方法
  1. def allocate_for_instance(self, context, instance, **kwargs):
  2.         """Allocates all network structures for an instance.
  3.         :returns: network info as from get_instance_nw_info() below
  4.         """
  5.         args = kwargs
  6.         args['instance_id'] = instance['id']
  7.         args['instance_uuid'] = instance['uuid']
  8.         args['project_id'] = instance['project_id']
  9.         args['host'] = instance['host']
  10.         args['rxtx_factor'] = instance['instance_type']['rxtx_factor']
  11.         nw_info = rpc.call(context, FLAGS.network_topic,
  12.                            {'method': 'allocate_for_instance',
  13.                              'args': args})
复制代码
RPC.call 与RPC.cast最大的不同 就是call方法需要一个response

3.png


Spawn instance

接下来我要说的就是虚拟化的driver spawn instance,我们这里使用的是libvirt(nova/virt/libvirt/lconnection.py)
  1. def spawn(self, context, instance, image_meta, network_info,
  2.               block_device_info=None):
  3.         xml = self.to_xml(instance, network_info, image_meta, False,
  4.                           block_device_info=block_device_info)
  5.         self.firewall_driver.setup_basic_filtering(instance, network_info)
  6.         self.firewall_driver.prepare_instance_filter(instance, network_info)
  7.         self._create_image(context, instance, xml, network_info=network_info,
  8.                            block_device_info=block_device_info)
  9.         self._create_new_domain(xml)
  10.         LOG.debug(_("Instance is running"), instance=instance)
  11.         self._enable_hairpin(instance)
  12.         self.firewall_driver.apply_instance_filter(instance, network_info)
  13.         def _wait_for_boot():
  14.             """Called at an interval until the VM is running."""
  15.             try:
  16.                 state = self.get_info(instance)['state']
  17.             except exception.NotFound:
  18.                 LOG.error(_("During reboot, instance disappeared."),
  19.                           instance=instance)
  20.                 raise utils.LoopingCallDone
  21.             if state == power_state.RUNNING:
  22.                 LOG.info(_("Instance spawned successfully."),
  23.                          instance=instance)
  24.                 raise utils.LoopingCallDone
  25.         timer = utils.LoopingCall(_wait_for_boot)
  26.         return timer.start(interval=0.5, now=True)
复制代码
  • 通过libvirt xml文件,然后根据xml文件生成instance
  • 准备network filter,默认的fierwall driver是iptables
  • image的创建(详细情况以后再介绍)
        def _create_image(self, context, instance, libvirt_xml, suffix='',
                      disk_images=None, network_info=None,
                      block_device_info=None):

         ...
  •    最后虚拟化driver的spawn()方法中调用driver 的creatXML()








来自群组: openstack技术组

已有(4)人评论

跳转到指定楼层
killingwolf 发表于 2014-2-10 18:54:07
多谢分享,学习下。
回复

使用道具 举报

killingwolf 发表于 2014-2-10 18:56:08
请楼主一个问题,物理机挂掉以后如何再另外一台物理机上启动挂掉的那些instance呢?
回复

使用道具 举报

pig2 发表于 2014-2-10 20:10:51
killingwolf 发表于 2014-2-10 18:56
请楼主一个问题,物理机挂掉以后如何再另外一台物理机上启动挂掉的那些instance呢?

可以查看下面帖子:
openstack计算节点宕机,不能恢复的实例总结

回复

使用道具 举报

killingwolf 发表于 2014-2-14 16:02:25
多谢楼主了。
官方用的是:nova evacuate,正在学习中。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条