Linux系统中虚拟化方法、技术及实现-lhftonny-ChinaUnix博客

Tonny的plog

首页　| 　博文目录　| 　关于我

lhftonny

博客访问： 169253
博文数量： 6
博客积分： 2431
博客等级：大尉
技术积分： 616
用户组：普通用户
注册时间： 2006-08-21 16:15

文章分类

全部博文（6）

General（1）
未分配的博文（5）

文章存档

2012年（1）

2011年（1）

2010年（4）

我的朋友

最近访客

推荐博文

Linux系统中虚拟化方法、技术及实现

分类：

2010-02-23 16:19:50

虚拟化的含义丰富，应用广泛。目前虚拟化技术主要关注于服务器虚拟化，即在一个宿主计算机上提供多个独立操作系统。本文将探索虚拟化背后的思想，然后讨论实现虚拟化的一些技术。我们还将了解现有的其他一些虚拟化技术，例如 Linux 上操作系统的虚拟化。

进行虚拟化 就是要将某种形式的东西以另外一种形式呈现出来。对计算机进行虚拟化就是要将计算机以多台计算机或一台完全不同的计算机的形式呈现出来。

虚拟化也能将多台计算机组合成一台计算机的形式呈现出来。这通常称为服务器聚合或网格计算。

下面让我们首先来看一下虚拟化的起源。

虚拟化的历史

虚拟化并不是什么新主题；实际上，他的存在已超过 40 年了。虚拟化技术最早的一些用法包括 IBM® 7044、麻省理工学院（MIT）在 IBM 704 上研发的 CTSS（Compatible Time Sharing System）及曼彻斯特大学的 Atlas 项目（世界上最早的终极计算机之一），这些都是请求页面调度和监管进程调用的先驱。

硬件虚拟化

IBM 早在 20 世纪 60 年代研发 System/360™ Model 67 大型机时就认识到了虚拟化的重要性。Model 67 通过 VMM（Virtual Machine Monitor）对所有的硬件接口都进行了虚拟化。在早期计算中，操作系统被称为 supervisor。能够在其他操作系统上运行的操作系统被称为 hypervisor（这个术语是在 20 世纪 70 年代出现的）。

VMM 能直接在底层硬件上运行，允许运行多个虚拟机（VM）。每个 VM 都能运行一个自己私有操作系统的实例 ?? 在早些时候，这称为 CMS（或 Conversational Monitor System）。之后 VM 继续发展，目前你能在 System z9™ 大型机上发现 VM。这提供了非常好的向后兼容性，甚至是对 System/360 产品线的兼容性。

处理器虚拟化

虚拟化早期的另外一种用法（在本例中是对处理器的仿真）是 P-code（或伪码）机。P-code 是一种机器语言，运行于虚拟机而不是实际硬件。P-code 早在 20 世纪 70 年代就已在加州大学圣地亚哥分校（UCSD）Pascal 系统上颇有名气了，他将 Pascal 程式编译成 P-code，然后在一个 P-code 虚拟机上运行。这就使 P-code 程式具有了高度的可移植性，而且，只要有可用的 P-code 虚拟机，P-code 程式就能运行。

Java 虚拟机（JVM）
Java™ 语言对自己的虚拟机沿用了这种 P-code 模型。这样只需要通过简单地移植 JVM 就能将 Java 程式广泛地分布到无数的体系架构上。

20 世纪 60 年代对 BCPL（Basic Combined Programming Language）的设计中也采用了相同的概念，C 语言即由 BCPL 发展而来。在这种用法中，编译器会将 BCPL 代码编译成称为 O-code 的中间机器代码。接下来的第二个步骤是将 O-code 编译成目标机器的原始语言。现代编译器所使用的这种模型为将编译器移植到新目标体系结构上提供了非常大的灵活性（通过一种中间语言将前端和后端分隔开来）。

指令集虚拟化

虚拟化最新的发展称为指令集虚拟化，或二进制转换。在这种模型中，虚拟指令集被转换成底层硬件的物理指令集，这个过程通常都是动态的。当代码执行时，就会对代码的某个段进行转换。如果出现分支情况，就会导入新代码集并进行转换。这使他和缓存操作非常类似，后者是将指令块从内存移动到本地快速缓存中执行。

这种模型最近在 Transmeta 设计的 Crusoe 中心处理单元（CPU）中得到了使用。二进制转换由 Code Morphing 的专利技术实现。类似的一个例子是完全虚拟化解决方案通过运行时代码扫描来查找和重定向特权指令（用来解决特定处理器指令集的一些问题）。

虚拟化和游戏
一篇有关虚拟化的文章如果不提一下 MAME（Multiple-Arcade Machine Emulator），就不算完整。顾名思义，MAME 就是以前非常多 arcade 游戏的一个完整的机器模拟器。除了对这些游戏中使用的处理器进行虚拟化之外，还能对整个机器进行虚拟化，包括声音、图像处理硬件和控制单元。MAME 是个非常不错的应用程式，不过要理解他们究竟实现了哪些功能，研读一下他的原始码会非常有帮助。

虚拟化的类型

实现虚拟化的方法不止一种。实际上，有几种方法都能通过不同层次的抽象来实现相同的结果。本节将介绍 Linux 中常用的 3 种虚拟化方法，及他们相应的优缺点。业界有时会使用不同的术语来描述相同的虚拟化方法。本文中使用的是最常用的术语，同时给出了其他术语以供参考。

硬件仿真

毫无疑问，最复杂的虚拟化实现技术就是硬件仿真。在这种方法中，能在宿主系统上创建一个硬件 VM 来仿真所想要的硬件，如图 1 所示。

图 1. 硬件仿真使用 VM 来模拟所需要的硬件

仿真和研发
硬件仿真的应用之一是进行固件和硬件的协作研发。固件研发人员能使用目标硬件 VM 在仿真环境中对自己的实际代码进行验证，而不必等到硬件实际可用的时候。

正如你所能预见的相同，使用硬件仿真的主要问题是速度会非常慢。由于每条指令都必须在底层硬件上进行仿真，因此速度减慢 100 倍的情况也并不稀奇。若要实现高度保真的仿真，包括周期精度、所仿真的 CPU 管道及缓存行为，实际速度差距甚至可能会达到 1000 倍之多。

硬件仿真也有自己的好处。例如，使用硬件仿真，你能在一个 ARM 处理器主机上运行为 PowerPC® 设计的操作系统，而不必所有修改。你甚至能运行多个虚拟机，每个虚拟器仿真一个不同的处理器。

完全虚拟化

完全虚拟化（full virtualization），也称为原始虚拟化，是另外一种虚拟化方法。这种模型使用一个虚拟机，他在客户操作系统和原始硬件之间进行协调（参见图 2）。“协调”在这里是个关键，因为 VMM 在客户操作系统和裸硬件之间提供协调。特定受保护的指令必须被捕捉下来并在 hypervisor 中进行处理，因为这些底层硬件并不由操作系统所拥有，而是由操作系统通过 hypervisor 共享。

图 2. 完全虚拟化使用 hypervisor 来共享底层硬件

老硬件上的 hypervisor
有些比较老的硬件，例如 x86，会给完全虚拟化带来一些问题。例如，需要 VMM 处理的一些特定敏感指令并没有捕捉。因此，hypervisor 必须要动态扫描并捕捉这些特权模式代码来解决这一问题。

虽然完全虚拟化的速度比硬件仿真的速度要快，不过其性能要低于裸硬件，因为中间经过了 hypervisor 的协调过程。完全虚拟化的最大好处是操作系统无需所有修改就能直接运行。惟一的限制是操作系统必须要支持底层硬件（例如 PowerPC）。

超虚拟化

超虚拟化（paravirtualization）是另外一种流行的虚拟化技术，他和完全虚拟化有一些类似。这种方法使用了一个 hypervisor 来实现对底层硬件的共享访问，还将和虚拟化有关的代码集成到了操作系统本身中（参见图 3）。这种方法不再需要重新编译或捕捉特权指令，因为操作系统本身在虚拟化进程中会相互紧密协作。

图 3. 超虚拟化和客户操作系统共享进程

正如前面介绍的相同，超虚拟化技术需要为 hypervisor 修改客户操作系统，这是他的一个缺点。不过超虚拟化提供了和未经虚拟化的系统相接近的性能。和完全虚拟化类似，超虚拟化技术能同时支持多个不同的操作系统。

操作系统级的虚拟化

我们要介绍的最后一种技术是操作系统级的虚拟化，他使用的技术和前面所介绍的有所不同。这种技术在操作系统本身之上实现服务器的虚拟化。这种方法支持单个操作系统，并能将独立的服务器相互简单地隔离开来（参见图 4）。

图 4. 操作系统级虚拟化实现服务器的隔离

操作系统级的虚拟化需求对操作系统的内核进行一些修改，不过其好处是能获得原始性能。

为什么虚拟化如此重要？

在了解目前 Linux 能使用的虚拟化方法之前，让我们先来了解一下虚拟化的好处。

从商业角度来看，使用虚拟化技术有非常多原因。大部分原因都能归结于服务器的巩固（server consolidation）。简单来说，如果你能对一个服务器上多个未经充分利用的系统进行虚拟化，由于服务器的数量少了，显然能节省大量电力、空间、制冷和管理成本。由于非常难确定服务器的利用情况，虚拟化技术支持称为动态迁移的技术。动态迁移（Live migration）允许操作系统及其应用程式迁移到新的服务器上，从而实现负载在可用硬件上的均衡。

虚拟化技术对于研发人员来说也非常重要。Linux 内核占据了一个单一的地址空间，这意味着内核或所有驱动程式的故障都会导致整个操作系统的崩溃。虚拟化技术意味着你能运行多个操作系统，如果其中一个系统由于某个 bug 而崩溃了，那么 hypervisor 和其他操作系统都依然能继续运行。这能使内核的调试非常类似于用户空间应用程式的调试。

和 Linux 有关的虚拟化项目

表 1 给出了几个 Linux 系统上的虚拟化项目，并着重介绍了其中的开源解决方案。

表 1. 和 Linux 有关的虚拟化项目

项目	类型	许可证
Bochs	仿真	LGPL
QEMU	仿真	LGPL/GPL
VMware	完全虚拟化	私有
z/VM	完全虚拟化	私有
Xen	超虚拟化	GPL
UML	超虚拟化	GPL
Linux-VServer	操作系统级虚拟化	GPL
OpenVZ	操作系统级虚拟化	GPL

有关其他解决方案的信息，请参看参考资料部分。

Bochs（仿真）

库级虚拟化
尽管在正文中没有讨论，库级虚拟化是另外一种能通过库对操作系统部分进行仿真的虚拟化技术。这种虚拟化技术的例子包括 Wine（Linux 上使用的一个部分 Win32 API）和 LxRun（Solaris 上使用的一个部分 Linux API）。

Bochs 是个 x86 计算机仿真器，他在非常多平台上（包括 x86、PowerPC、Alpha、SPARC 和 MIPS）都能移植和运行。使 Bochs 更为有趣的是他不仅能对处理器进行仿真，还能对整个计算机进行仿真，包括计算机的外围设备，比如键盘、鼠标、视频图像硬件、网卡（NIC）等。

Bochs 能设置作为一个老式的 Intel® 386 或其后继处理器使用，例如 486、Pentium、Pentium Pro 或 64 位处理器。他甚至还能对一些可选的图像指令进行仿真，例如 MMX 和 3DNow。

使用 Bochs 仿真器，你能运行所有 Linux 上的 Linux 发行版、Linux 上的 Microsoft® 视窗系统® 95/98/NT/2000（及各种应用程式），甚至 Linux 上的 BSD（Berkeley Software Distribution）操作系统（FreeBSD、OpenBSD 等）。

QEMU（仿真）

QEMU 是另外一个仿真器，他和 Bochs 非常类似，不过也有一些值得一提的差别。QEMU 支持两种操作模式。第一种是 Full System Emulation（完全系统仿真）模式。这种模式和 Bochs 非常类似，他能对一个具有处理器和外围设备的完整个人计算机（PC）进行仿真。这种模式能仿真非常多处理器架构，例如 x86、x86_64、ARM、SPARC、PowerPC 和 MIPS，其动态转换的速度也比较最佳。使用这种模式，你能在 Linux、Solaris 和 FreeBSD 上仿真视窗系统操作系统（包括 XP）和 Linux。非常多其他操作系统的组合也都能得到支持（更多信息请参看参考资料部分）。

QEMU 还能支持第二种模式，称为 User Mode Emulation（用户模式仿真）。这种模式只能宿主于 Linux，在这种模式下，能启动不同体系结构的二进制文件。例如，在 x86 平台上运行的 Linux 系统上能执行为 MIPS 体系架构编译的二进制文件。这种模式支持的其他体系结构还包括 ARM、SPARC 和 PowerPC，而且更有非常多尚在研发之中。

VMware（完全虚拟化）

VMware 是完全虚拟化的一个商业解决方案。在客户操作系统和裸硬件之间有一个 hypervisor 作为抽象层使用。这个抽象层允许所有操作系统在硬件上运行，而不必了解所有其他客户操作系统。

VMware 也会对可用的 I/O 硬件进行虚拟化，并将一些高性能的设备驱动程式加入到 hypervisor 中。

整个虚拟化后的环境都作为一个文件保存，这意味着整个系统（包括客户操作系统、VM 和虚拟硬件）能非常容易地快速迁移到新宿主机器上进行负载均衡。

z/VM （完全虚拟化）

尽管 IBM System z™ 是个新品牌，不过他实际上已有非常长的一段历史，能一直追溯到 20 世纪 60 年代。System/360 在 1965 年就能支持使用虚拟机进行虚拟化。有趣的是，System z 保留了对之前的 System/360 产品线的向后兼容性。

z/VM® 是 System z 上的操作系统 hypervisor。其核心是 Control Program（CP），他为客户操作系统，包括 Linux，提供了物理资源的虚拟化（参见图 5）。这样，多个处理器和其他资源就能在多个客户操作系统上被虚拟化。

图 5. 使用 z/VM 的操作系统级虚拟化

z/VM 也能为想要相互通信的客户操作系统仿真一个客户局域网（LAN）。仿真完全是在 hypervisor 中进行的，因此相当安全。

Xen（超虚拟化）

Xen 是个来自于 XenSource 的操作系统级超虚拟化的免费开源解决方案。回想一下在超虚拟化中，hypervisor 和操作系统会一起协作，虽然操作系统需要进行一些更改，但却能带来接近于原始系统的性能。

就像 Xen 需要进行协作（对客户操作系统进行修改）相同，只有那些修补过的操作系统才能通过 Xen 进行虚拟化。Linux 本身就是开源的，所以从 Linux 角度来看，这是个非常合理的折衷，因为最终能获得比完全虚拟化更好的性能。不过从广泛支持的角度来看（例如对其他非开源操作系统的支持），这显然是个缺点。

视窗系统能在 Xen 上作为一个客户操作系统运行，不过他只能在运行 Intel Vanderpool 或 AMD Pacifica 的系统上使用。支持 Xen 的其他操作系统包括 Minix、Plan 9、NetBSD、FreeBSD 和 OpenSolaris。

User-mode Linux（超虚拟化）

User-mode Linux（UML）允许 Linux 操作系统在其他操作系统的用户空间中运行。每个客户 Linux 操作系统都存在于宿主 Linux 操作系统中的一个进程中（参见图 6）。这就允许 Linux 内核（使用自己的相关用户空间）在单个 Linux 内核中运行。

图 6. User-mode Linux 中的 Linux

在 2.6 版本的 Linux 内核中，UML 驻留于主内核树内，但他必须提前启用，然后再重新编译才能使用。这些变化除了常见的虚拟化功能之外，还能提供设备的虚拟化。这样一来，客户操作系统就能共享可用的物理设备，例如块设备（比如软盘、CD-ROM 和文件系统）、控制台、NIC 设备、声音硬件等。

注意由于客户内核是在应用程式空间中运行的，因此他们必须为这种用法而被特别编译（不过他们能是不同的内核版本）。这样就产生了主机内核（硬件上的内核）和客户内核（在主机内核的用户空间中运行）。这些内核甚至能是嵌套的，这样就允许一个客户内核在另外一个运行于主机内核的客户内核上运行。

Linux-VServer（操作系统级虚拟化）

Linux-VServer 是个操作系统级虚拟化解决方案。Linux-VServer 对 Linux 内核进行虚拟化，这样多个用户空间环境 ?? 又称为 Virtual Private Server（VPS） ?? 就能独立运行，而不必互相了解。Linux-VServer 通过修改 Linux 内核实现用户空间的隔离。

要将各个用户空间和其他用户空间隔离开来，就需要从上下文的概念入手。上下文 是给定 VPS 进程使用的一个容器，这样通过诸如 ps 之类的工具就能了解 VPS 的进程。内核为最初的引导定义了一个缺省的上下文。另外管理端还能查看所有的上下文（所有的执行进程）。正如你可能猜到的那样，内核和内部数据结构也需要进行修改来支持这种虚拟化方法。

Linux-VServer 还使用了一种 chroot 格式来为每个 VPS 隔离 root 目录。虽然 chroot 允许指定新 root 目录，但还是需要其他一些功能（称为 Chroot-Barrier）来限制 VPS 脱离其隔离的 root 目录回到上级目录。给定一个隔离的 root 目录之后，每个 VPS 就能拥有自己的用户列表和 root 密码。

2.4 和 2.6 版本的 Linux 内核支持 Linux-VServer，他能运行于非常多平台之上，包括 x86、x86-64、SPARC、MIPS、ARM 和 PowerPC。

OpenVZ（操作系统级虚拟化）

OpenVZ 是另外一个操作系统级的虚拟化解决方案，他和 Linux-VServer 类似，不过也有一些有趣的差别。OpenVZ 是个支持虚拟化的内核（修改过的），能支持用户空间隔离、VPS 和一组用户管理工具。例如，你能简单地从命令行创建一个新的 VPS：

清单 1. 从命令行创建 VPS

$ vzctl create 42 --ostemplate fedora-core-4
Creating VPS private area
VPS private area was created
$ vzctl start 42
Starting VPS ...
VPS is mounted

另外还能使用 vzlist 命令显示目前创建的 VPS，该命令和标准 Linux ps 命令类似。

为了对进程进行调度，OpenVZ 还包括了两级 CPU 调度器。首先，调度器确定哪个 VPS 应该获得 CPU。在这个步骤完成之后，第二级调度器会根据给定的标准 Linux 优先级挑选进程来执行。

OpenVZ 还包括了所谓的 beancounters。beancounter 包括非常多参数，这些参数为给定的 VPS 定义了资源分配。这为 VPS 提供了一定层次上的控制，定义了有多少内存可用，有多少进程间通信（IPC）对象可用等。

OpenVZ 的一个特性是检查点功能和将 VPS 从一个物理服务器迁移到其他物理服务器上的能力。检查点 意味着正在运行的 VPS 的状态被冻结并存储到一个文件中。然后能将这个文件迁移到一个新服务器上并加以还原以使 VPS 恢复运行。

OpenVZ 支持非常多硬件体系结构，包括 x86、x86-64 和 PowerPC。

对完全虚拟化和超虚拟化的硬件支持

回想一下 IA-32（x86）体系结构在进行虚拟化时会产生的一些问题。特定的特权模式指令无法捕捉，基于所使用的模式还可能返回不同的结果。例如，x86 STR 指令能检索安全状态，不过所返回的值要取决于请求者特定的特权级别。在尝试在不同的层次对不同的操作系统进行虚拟化时，这会出现问题。例如，x86 支持 4 环保护，其中级别 0 （最高特权）通常运行操作系统，级别 1 和 2 支持操作系统服务，级别 3（最低级别）支持应用程式。不过硬件供给商已认识到了这种缺陷（及其他一些问题），并且已研发了一些支持并加速虚拟化的新设计。

Intel 正在研发新虚拟化技术，能在 x86（VT-x）和 Itanium®（VT-i）体系架构上支持 hypervisor。VT-x 支持两种格式的操作，一种用于 VMM（root），另外一种用于客户操作系统（非 root）。root 格式完全是特权级的，而非 root 格式是非特权级的（即使对环 0 来说也是如此）。这种体系架构支持定义指令来使 VM（客户操作系统）退出到 VMM 和保存处理器状态。此外还添加了许多其他的功能，请参看参考资料部分。

AMD 也研发了硬件辅助虚拟化技术，称为 Pacifica。除了其他一些特性之外，Pacifica 还为在特别指令执行时保存的客户操作系统维护了一个控制块。VMRUN 指令允许虚拟机（及其相关的客户操作系统）一直运行，直到 VMM 重新获得控制权为止（这也是可设置的）。这种可设置能力允许 CMM 为每个客户操作系统制定特权指令。Pacifica 还能使用宿主和客户内存管理单元（MMU）表来进行地址转换。

这些新技术也能应用到此处讨论的非常多其他虚拟化技术中，包括 Xen、VMware、User-mode Linux 等。

Linux KVM（内核虚拟机）

Linux 传出的最新消息是将 KVM 合并到 Linux 内核中（2.6.20）。KVM 是一种完全虚拟化解决方案，他有一个方面非常独特：他将 Linux 内核转换为一个使用内核模块的 hypervisor。这个模块允许使用其他客户操作系统，然后在宿主 Linux 内核的用户空间中运行（参见图 7）。内核中的 KVM 通过 /dev/kvm 字符设备来公开虚拟化后的硬件。客户操作系统使用为 PC 硬件仿真修改过的 QEMU 进程和 KVM 模块接口。

图 7. 使用内核虚拟机（KVM）的虚拟化

KVM 模块向内核中引入了一个新的执行模块。普通内核支持内核模式和用户模式，而 KVM 则引入了一种客户模式。客户模式用来执行所有非 I/O 客户代码，而普通用户模式支持客户 I/O。

KVM 的引入是 Linux 的一个有趣革新，因为他代表了作为主流 Linux 内核一部分的第一个虚拟化技术。他已存在于 2.6.20 树中，不过也能作为 2.6.19 内核的一个内核模块使用。当在支持虚拟化的硬件上运行时，KVM 支持 Linux（32 位和 64 位）和视窗系统（32 位）客户机。有关 KVM 的更多信息，请参看参考资料部分。

结束语

如果 40 年前出现的技术还能算是“新”技术的话，那么虚拟化就是个重要的新技术领域。虚拟化技术已在非常多场合中应用过了，但目前主要的关注点是服务器和操作系统的虚拟化。和 Linux 非常类似，虚拟化为性能、可移植性和灵活性提供了非常多选项。这意味着你能选择最适合于你自己应用程式的虚拟化方法。

阅读(2693) | 评论(0) | 转发(0) |

上一篇：没有了

下一篇：主板接口最全介绍

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6