首页　| 　博文目录　| 　关于我

博客访问： 10667214
博文数量： 1669
博客积分： 16831
博客等级：上将
技术积分： 12594
用户组：普通用户
注册时间： 2011-02-25 07:23

个人简介

柔中带刚，刚中带柔，淫荡中富含柔和，刚猛中荡漾风骚，无坚不摧，无孔不入！

文章分类

全部博文（1669）

NGINX（1）
MongoDB（2）
docker（8）
shadowsocks（1）
CloudFoundry（11）
CloudStack（102）
openstack（61）
PHP（0）
mail（0）
hadoop（25）
GemFire（1）
文件系统（4）
CDN（7）
下载及资源（15）
数据缓存（8）
web 加速（9）
分布式文件系统架（23）
虚拟化（133）
同步（6）
网站架构（50）
windows 监控（15）
mysql 监控（5）
oracle 监控（2）
linux 监控（24）
web 监控（35）
其他数据库（27）
备份恢复（28）
VPN及认证（24）
云系统（29）
windows（29）
WEB 故障（13）
mysql 备份（10）
oracle 集群（15）
HA及负载均衡（52）
存储（66）
shell（39）
web 应用（19）
mysql 优化（16）
mysql 故障（14）
mysql 安全（8）
mysql 配置（29）
mysql 应用（10）
web 安全（21）
SAN交换路由（26）
web 优化（46）
基础解释（24）
linux 安全（37）
linux 故障（22）
linux 应用（85）
linux 配置（64）
web 配置（23）
oracle 备份（33）
UNIX（12）
Solaris（5）
Aix（1）
oracle 配置（69）
oracle 优化（62）
oracle 安全（10）
oracle 应用（30）
交流（29）
oracle 故障（59）
linux 优化（31）
未分配的博文（4）

文章存档

2023年（4）

2022年（1）

2021年（10）

2020年（24）

2019年（4）

2018年（19）

2017年（66）

2016年（60）

2015年（49）

2014年（201）

2013年（221）

2012年（638）

2011年（372）

我的朋友

openstack源码解析之虚机创建
http://blog.csdn.net/weixin_39400463/article/details/76407950

标签：

2017-07-30 22:06 29人阅读评论(0) 举报

		 分类：
	
		openstack（2）

		版权声明：本文为博主原创文章，未经博主允许不得转载。
	

首先先看图，请求从nova-api发起，然后到nova-conductor，再到scheduler进行调度，调度选中某台机器后，通过rpc请求，发送到某台机器上执行创建机器方法，期间会访问glance获取镜像生成磁盘文件，也会访问neutron获取网络相关信息，最后调用libvirt，生成虚机，后面会逐个通过源码给大家讲解。

nova-api

创建虚机，这里从nova层面开始分析。通过http请求，带着参数访问到nova-api。

nova/api//compute/servers.py

				[html] view plaincopy
				
				def create(self, req, body):  
			
				    if body and 'servers' in body:  
			
				        context = req.environ['nova.context']  
			
				        servers = body['servers']  
			
				        return self.create_servers(context, req, servers)

顺着create_server方法进去，进到_create这个方法中，这个方法会获取参数信息，比如机器名字，套餐等，做一些基本验证，并且调用compute_api的create方法

				[html] view plaincopy
				
				def _create(self, context, body, password):  
			
				            return self.compute_api.create(context,..

compute_api指的是nova.compute.api.API

nova/compute/api.py

				[html] view plaincopy
				
				def create(self, context, instance_type,  
			
				               image_href, kernel_id=None, ramdisk_id=None,  
			
				               min_count=None, max_count=None,  
			
				               display_name=None, display_description=None,  
			
				               key_name=None, key_data=None, security_group=None,  
			
				               availability_zone=None, user_data=None, metadata=None,  
			
				               injected_files=None, admin_password=None,  
			
				               block_device_mapping=None, access_ip_v4=None,  
			
				               access_ip_v6=None, requested_networks=None, config_drive=None,  
			
				               auto_disk_config=None, scheduler_hints=None, legacy_bdm=True):  
			
				               ...  
			
				               return self._create_instance(  
			
				                               context, instance_type,  
			
				                               image_href, kernel_id, ramdisk_id,  
			
				                               min_count, max_count,  
			
				                               display_name, display_description,  
			
				                               key_name, key_data, security_group,  
			
				                               availability_zone, user_data, metadata,  
			
				                               injected_files, admin_password,  
			
				                               access_ip_v4, access_ip_v6,  
			
				                               requested_networks, config_drive,  
			
				                               block_device_mapping, auto_disk_config,  
			
				                               scheduler_hints=scheduler_hints,  
			
				                               legacy_bdm=legacy_bdm)

继续跟进到_create_instance方法里面，会做一系列参数验证和封装，进而插入数据库instance的记录，然后调用rpc请求

				[html] view plaincopy
				
				def _create_instance(self, context, instance_type,  
			
				              image_href, kernel_id, ramdisk_id,  
			
				              min_count, max_count,  
			
				              display_name, display_description,  
			
				              key_name, key_data, security_groups,  
			
				              availability_zone, user_data, metadata,  
			
				              injected_files, admin_password,  
			
				              access_ip_v4, access_ip_v6,  
			
				              requested_networks, config_drive,  
			
				              block_device_mapping, auto_disk_config,  
			
				              reservation_id=None, scheduler_hints=None,  
			
				              legacy_bdm=True):  
			
				              ...  
			
				              for instance in instances:  
			
				                self._record_action_start(context, instance,  
			
				                                     instance_actions.CREATE)  
			
				              self.compute_task_api.build_instances...

这个请求会跑到nova/conductor/rpcapi.py中的

				[html] view plaincopy
				
				def build_instances(self, context, instances, image, filter_properties,  
			
				            admin_password, injected_files, requested_networks,  
			
				            security_groups, block_device_mapping, legacy_bdm=True):  
			
				        image_p = jsonutils.to_primitive(image)  
			
				        cctxt = self.client.prepare(version='1.5')  
			
				        cctxt.cast(context, 'build_instances',  
			
				                   instances=instances, image=image_p,  
			
				                   filter_properties=filter_properties,  
			
				                   admin_password=admin_password,  
			
				                   injected_files=injected_files,  
			
				                   requested_networks=requested_networks,  
			
				                   security_groups=security_groups,  
			
				                   block_device_mapping=block_device_mapping,  
			
				                   legacy_bdm=legacy_bdm)

这个时候发送了rpc请求，我们用的是 zmq点对点，发送到conductor节点上，进到cctxt.cast这个方法里面，看下nova/conductor/rpcapi.py这个文件

				[html] view plaincopy
				
				def __init__(self):  
			
				        super(ComputeTaskAPI, self).__init__()  
			
				        target = messaging.Target(topic=CONF.conductor.topic,  
			
				                                  namespace='compute_task',  
			
				                                  version='1.0')  
			
				        serializer = objects_base.NovaObjectSerializer()  
			
				        self.client = rpc.get_client(target, serializer=serializer)

nova-conductor

进入到nova/conductor/manager.py这个文件的build_instances方法

				[html] view plaincopy
				
				def build_instances(self, context, instances, image, filter_properties,  
			
				            admin_password, injected_files, requested_networks,  
			
				            security_groups, block_device_mapping, legacy_bdm=True):  
			
				            ...  
			
				            self.scheduler_rpcapi.new_run_instance(context,  
			
				                    request_spec=request_spec, admin_password=admin_password,  
			
				                    injected_files=injected_files,  
			
				                    requested_networks=requested_networks, is_first_time=True,  
			
				                    filter_properties=filter_properties,  
			
				                    legacy_bdm_in_spec=legacy_bdm)

我们这里改造了下，直接用了new_run_instance这个方法，进去再看下 nova/scheduler/rpcapi.py

				[html] view plaincopy
				
				def new_run_instance(self, ctxt, request_spec, admin_password,  
			
				            injected_files, requested_networks, is_first_time,  
			
				            filter_properties, legacy_bdm_in_spec=True):  
			
				        msg_kwargs = {'request_spec': request_spec,  
			
				                      'admin_password': admin_password,  
			
				                      'injected_files': injected_files,  
			
				                      'requested_networks': requested_networks,  
			
				                      'is_first_time': is_first_time,  
			
				                      'filter_properties': filter_properties,  
			
				                      'legacy_bdm_in_spec': legacy_bdm_in_spec}  
			
				        cctxt = self.client.prepare()  
			
				        cctxt.cast(ctxt, 'new_run_instance', **msg_kwargs)

这个时候是发送了zmq请求到了scheduler上了，具体的发送过程，看下这个类的__init__方法即可。

nova-scheduler

方法到了nova/scheduler/manager.py这个文件中，我们看SchedulerManager这个类的new_run_instance方法

				[html] view plaincopy
				
				def new_run_instance(self, context, request_spec, admin_password,  
			
				            injected_files, requested_networks, is_first_time,  
			
				            filter_properties, legacy_bdm_in_spec=True):  
			
				            ...  
			
				            return self.driver.new_schedule_run_instance(context,  
			
				                        request_spec, admin_password, injected_files,  
			
				                        requested_networks, is_first_time, filter_properties,  
			
				                        legacy_bdm_in_spec)

这个用到了driver, 这个driver指的就是你使用的过滤器，可能是内存有限过滤，或者CPU, 或者硬盘。这块我们选的驱动是nova.scheduler.filter_scheduler.FilterScheduler，我们进到这个驱动，看下new_schedule_run_instance这个方法。nova/scheduler/filter_scheduler.py, 类FilterScheduler下的new_schedule_run_instance方法：

				[html] view plaincopy
				
				def new_schedule_run_instance(self, context, request_spec,  
			
				                              admin_password, injected_files,  
			
				                              requested_networks, is_first_time,  
			
				                              filter_properties, legacy_bdm_in_spec):  
			
				        ...  
			
				        try:  
			
				            self._new_schedule_run_instance(context, request_spec,  
			
				                    admin_password, injected_files,  
			
				                    requested_networks, is_first_time,  
			
				                    filter_properties, legacy_bdm_in_spec)  
			
				        ..

这里说说下host_queue, 这个是定时加载的，默认时间是10s, 在nova/scheduler/manager.py中

				[html] view plaincopy
				
				@periodic_task.periodic_task(spacing=CONF.new_scheduler_build_queue_period,  
			
				                             run_immediately=True)  
			
				def build_queue(self, context):  
			
				    current = host_queue.QueueManager()  
			
				    current.init_host_queue(context)  
			
				    current.build_queue()

看下build_queue的具体实现 nova/scheduler/host_queue.py

				[html] view plaincopy
				
				def build_queue(self):  
			
				    ...  
			
				    # 从数据库读取compute节点  
			
				    self.compute_nodes = db.compute_node_get_all(elevated)  
			
				    for compute in self.compute_nodes:  
			
				        # 获取extra_resources信息  
			
				        extra_resources = compute.get('extra_resources')  
			
				        # 获取hostname  
			
				        hostname = compute.get('hypervisor_hostname')  
			
				        # 获取queue_name, 默认是kvm  
			
				        queue_name = extra_resources.get('queue_name')  
			
				        new_queue = []  
			
				        if not queue_name:  
			
				            queue_name = CONF.default_queue  
			
				        ...  
			
				        # 过滤掉disabled的机器  
			
				        if service['disabled']:  
			
				            LOG.warn("Compute service disabled %s", hostname)  
			
				            continue  
			
				        ...  
			
				        # 获取磁盘，cpu, 内存超售比，这些值都是计算节点通过定时任务，汇报自己配置文件信息到数据库中，具体的方法就是resource_tracker  
			
				        disk_allocation_ratio = extra_resources.get('disk_allocation_ratio', 1.0)  
			
				        cpu_allocation_ratio = extra_resources.get('cpu_allocation_ratio', 1.0)  
			
				        ram_allocation_ratio = extra_resources.get('ram_allocation_ratio', 1.0)  
			
				        ...  
			
				        # 获取cpu总量，使用量，空闲量  
			
				        vcpus = compute['vcpus'] * cpu_allocation_ratio  
			
				        vcpus_used = compute['vcpus_used']  
			
				        free_vcpus = vcpus - compute['vcpus_used']  
			
				        limits['vcpu'] = vcpus  
			
				        local_gb = compute['local_gb'] * disk_allocation_ratio  
			
				        free_local_gb = local_gb - \  
			
				                        (compute['local_gb'] - compute['free_disk_gb'])  
			
				        limits['disk_gb'] = local_gb  
			
				        # memory_mb  
			
				        memory_mb = compute['memory_mb'] * ram_allocation_ratio  
			
				        free_memory_mb = memory_mb - \  
			
				                        (compute['memory_mb'] - compute['free_ram_mb'])  
			
				        limits['memory_mb'] = memory_mb  
			
				        ...  
			
				        # 生成对象值，放入QueueManager.host_info中  
			
				        QueueManager.host_info[hostname] = BaseQueue(  
			
				                     hostname=hostname,  
			
				                     vcpus=vcpus, vcpus_used=vcpus_used, free_vcpus=free_vcpus,  
			
				                     memory_mb=memory_mb,  
			
				                     free_memory_mb=free_memory_mb, local_gb=local_gb,  
			
				                     free_local_gb=free_local_gb, net_bandwidth=net_bandwidth,  
			
				                     net_bandwidth_used=net_bandwidth_used,  
			
				                     free_net_bandwidth=free_net_bandwidth,  
			
				                     disk_bandwidth=disk_bandwidth,  
			
				                     disk_bandwidth_used=disk_bandwidth_used,  
			
				                     free_disk_bandwidth=free_disk_bandwidth,  
			
				                     multi_disk_info=multi_disk_info,  
			
				                     updated_at=updated_at, queue_name=queue_name,  
			
				                     limits=limits)

我们再回过头继续看调度这块，既然host_queue都有了，我们继续往下看。nova/scheduler/filter_scheduler.py

				[html] view plaincopy
				
				def _new_schedule_run_instance(self, context, request_spec,  
			
				                              admin_password, injected_files,  
			
				                              requested_networks, is_first_time,  
			
				                              filter_properties, legacy_bdm_in_spec):  
			
				        ## 获取参数  
			
				        ..  
			
				        ## 这里参数中如果指定了scheduler_host，直接调度到指定物理机中去创建机器。  
			
				        if scheduler_host:  
			
				            self.schedule_instance_to_assigned_host(context, request_spec,  
			
				            admin_password, injected_files,  
			
				            requested_networks, is_first_time,  
			
				            filter_properties, legacy_bdm_in_spec,  
			
				            scheduler_host, disk_shares,  
			
				            instance_uuids, scheduler_hints)  
			
				         return  
			
				         ..  
			
				         ## 默认的queue_name叫kvm, 获取队列名字下的机器，这个是在host_queue文件初始化的时候构建的。  
			
				         host_queue = self.get_host_queue(queue_name)  
			
				         # 如果有值，这个用的是正则匹配，匹配机器名字中含有scheduler_host_match值的机器  
			
				         if scheduler_host_match:  
			
				                host_queue = self._get_matched_host_queue(host_queue, scheduler_host_match)  
			
				                LOG.debug("matched host queue (%s): %s length is: %d", scheduler_host_match,  
			
				                        queue_name, len(host_queue))  
			
				          ...  
			
				          # 这里设置了一个值，requested_disk值就是虚机根分区的大小，加上用户分区，再加上swap空间大小，这个在后面比对会用上  
			
				          req_res['requested_disk'] = 1024 * (instance_type['root_gb'] +  
			
				                        instance_type['ephemeral_gb']) + \  
			
				                        instance_type['swap']  
			
				          # 这个方法就是直接调度获取到匹配传递的参数的机器，这个在下面的方法中讲解  
			
				          host = self._new_schedule(context, host_queue,  
			
				                            req_res, request_spec,  
			
				                            copy_filter_properties,  
			
				                            instance_uuid, retry,  
			
				                            different_host_flag,  
			
				                            different_host, disk_shares,  
			
				                            try_different_host, sign, boundary_host)  
			
				          # 获取到机器了，这个时候就继续发送点对点请求，给对应的机器，去创建虚拟机  
			
				          self.pool.spawn(self.compute_rpcapi.new_run_instance,  
			
				                            context, instance_uuid, host.hostname,  
			
				                            request_spec, copy_filter_properties,  
			
				                            requested_networks, injected_files,  
			
				                            admin_password, is_first_time,  
			
				                            host.hostname, legacy_bdm_in_spec, self._disk_info)

我们继续来看_new_scheduler, 还是在这个文件中

				[html] view plaincopy
				
				def _new_schedule(self, context, host_queue, req_res,  
			
				        request_spec, filter_properties,  
			
				        instance_uuid, retry=None,  
			
				        different_host_flag=None,  
			
				        different_host=None,  
			
				        disk_shares=None,  
			
				        try_different_host=None,  
			
				        sign=1,  
			
				        boundary_host=None):  
			
				        ..  
			
				        # 这个含义是，如果设置了different_host为true, 则虚机的调度，要调度到不同的物理机上。  
			
				          这里的实现是通过check_host_different_from_uuids方法，每次选中的host放到数组里面，  
			
				          然后下一次选中的host, 验证下是否在这个数组里面。  
			
				        if different_host:  
			
				            LOG.debug('instance %s different_host: %s', instance_uuid,  
			
				                different_host)  
			
				            if not self.check_host_different_from_uuids(context,  
			
				                instance_uuid, host, different_host):  
			
				                self._find_pos = self._find_pos + sign * 1  
			
				                continue  
			
				        # 这里查看资源是否充足  
			
				        resource_check = self.check_host_resource(context,  
			
				        host=host,  
			
				        req_res=req_res,  
			
				        disk_shares=disk_shares)  
			
				        # 如果匹配，返回host

我们继续深入方法里面，看下check_host_resource方法做了什么（依然还在这个文件中）

				[html] view plaincopy
				
				def check_host_resource(self, context, host, req_res,  
			
				                    disk_shares=0):  
			
				        ...  
			
				        # 检查要申请的磁盘空间是否比物理机上空闲的磁盘大，如果大，就返回False, 告知check不通过  
			
				        usable_disk_mb = host.free_local_gb * 1024  
			
				        if not usable_disk_mb >= req_res['requested_disk']:  
			
				            return False  
			
				        # check 内存  
			
				        if req_res['requested_ram'] > 0:  
			
				            usable_ram = host.free_memory_mb  
			
				            if not usable_ram >= req_res['requested_ram']:  
			
				                return False  
			
				        # check vcpus  
			
				        if req_res['requested_vcpus'] > 0:  
			
				            if host.free_vcpus < req_res['requested_vcpus']:  
			
				                return False  
			
				        return True

nova-compute

通过rpc调用到对应的host节点，执行new_run_instance方法

				[html] view plaincopy
				
				def new_run_instance(self, context, instance_uuid, request_spec,  
			
				                 filter_properties, requested_networks,  
			
				                 injected_files, admin_password,  
			
				                 is_first_time, node, legacy_bdm_in_spec,  
			
				                 disk_info=None):  
			
				    # 一方面更新数据库状态，另外一方面，更新资源使用量  
			
				    if disk_info:  
			
				        instance = self._instance_update(  
			
				                    context, instance_uuid,  
			
				                    disk_shares=disk_info['disk_shares'],  
			
				                    selected_dir=disk_info['selected_dir'])  
			
				    else:  
			
				        instance = self._instance_update(context,  
			
				                instance_uuid)  
			
				    self.run_instance(context, instance, request_spec,  
			
				                filter_properties, requested_networks, injected_files,  
			
				                admin_password, is_first_time, node,  
			
				                legacy_bdm_in_spec)<span style=" font-size: 24px;"><strong>  
			
				strong>span>

继续往下看，进入run_instance方法

				[html] view plaincopy
				
				def _run_instance(self, context, request_spec,  
			
				                  filter_properties, requested_networks, injected_files,  
			
				                  admin_password, is_first_time, node, instance,  
			
				                  legacy_bdm_in_spec):  
			
				      # 首先检查下机器名字是否存在，然后更新下数据库，改成building状态  
			
				      self._prebuild_instance(context, instance)  
			
				      ...  
			
				      instance, network_info = self._build_instance(context,  
			
				              request_spec, filter_properties, requested_networks,  
			
				              injected_files, admin_password, is_first_time, node,  
			
				              instance, image_meta, legacy_bdm_in_spec)

这个时候，进入方法里面，通过neutron服务获取mac和IP信息（这块就不细说了），直接看代码

				[html] view plaincopy
				
				def _build_instance(self, context, request_spec, filter_properties,  
			
				            requested_networks, injected_files, admin_password, is_first_time,  
			
				            node, instance, image_meta, legacy_bdm_in_spec):  
			
				    ..  
			
				    # 查询这个实例上挂了多少盘  
			
				    bdms = block_device_obj.BlockDeviceMappingList.get_by_instance_uuid(  
			
				        context, instance['uuid'])  
			
				    ..  
			
				    # 更新资源使用量，cpu 内存 硬盘  
			
				    with rt.instance_claim(context, instance, limits):  
			
				      ...  
			
				      # neutron将会为VM分配MAC和IP  
			
				      network_info = self._allocate_network(context, instance,  
			
				                        requested_networks, macs, security_groups,  
			
				                        dhcp_options)  
			
				     instance = self._spawn(context, instance, image_meta,  
			
				                                       network_info, block_device_info,  
			
				                                       injected_files, admin_password,  
			
				                                       set_access_ip=set_access_ip)

spawn方法是相对比较底层的，里面涉及镜像和创建虚机

				[html] view plaincopy
				
				def spawn(self, context, instance, image_meta, injected_files,  
			
				          admin_password, network_info=None, block_device_info=None):  
			
				    disk_info = blockinfo.get_disk_info(CONF.libvirt.virt_type,  
			
				                                        instance,  
			
				                                        block_device_info,  
			
				                                        image_meta)  
			
				    # 需要注入的文件内容，最后会以字符串的形式写入injected_files中  
			
				    if CONF.libvirt.inject_nifcfg_file:  
			
				        self._mk_inject_files(image_meta, network_info, injected_files)  
			
				    # 创建磁盘镜像文件 disk disk.local等  
			
				    self._create_image(context, instance,  
			
				                       disk_info['mapping'],  
			
				                       network_info=network_info,  
			
				                       block_device_info=block_device_info,  
			
				                       files=injected_files,  
			
				                       admin_pass=admin_password)  
			
				    # 生成libvirt.xml文件  
			
				    xml = self.to_xml(context, instance, network_info,  
			
				                      disk_info, image_meta,  
			
				                      block_device_info=block_device_info,  
			
				                      write_to_disk=True)  
			
				    # 创建真正的虚机实例domain  
			
				    self._create_domain_and_network(context, xml, instance, network_info,  
			
				                                    block_device_info)  
			
				    LOG.debug(_("Instance is running"), instance=instance)  
			
				    # 监控状态是否ok, ok的话返回  
			
				    def _wait_for_boot():  
			
				        """Called at an interval until the VM is running."""  
			
				        state = self.get_info(instance)['state']  
			
				        if state == power_state.RUNNING:  
			
				            LOG.info(_("Instance spawned successfully."),  
			
				                     instance=instance)  
			
				            raise loopingcall.LoopingCallDone()  
			
				    timer = loopingcall.FixedIntervalLoopingCall(_wait_for_boot)  
			
				    timer.start(interval=0.5).wait()

至此整个流程讲完了，有很多细的地方没有讲到，后续会在源码分析的其他章节讲解。

阅读(1549) | 评论(0) | 转发(0) |

上一篇：openstack源码解析之虚机修改密码

下一篇：清除交换机中被锁定VTY

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6

openstack源码解析之虚机创建 http://blog.csdn.net/weixin_39400463/article/details/76407950

openstack源码解析之虚机创建
http://blog.csdn.net/weixin_39400463/article/details/76407950