分类: LINUX
2016-02-29 13:14:45
程序员必须让拥有依赖关系的进程集协调,这样才能达到进程的共同目标。可以使用两种技术来达到协调。第一种技术在具有通信依赖关系的两个进程间传递信息。这种技术称做进程间通信(interprocess communication)。第二种技术是同步,当进程间相互具有合作依赖时使用。这两种类型的依赖关系可以同时存在。
一般而言,进程有单独的地址空间。我们可以了解下可执行程序被装载到内存后建立的一系列映射等理解这一点。如此以来意味着如果我们有两个进程(进程A和进程B),那么,在进程A中声明的数据对于进程B是不可用的。而且,进程B看不到进程A中发生的事件,反之亦然。如果进程A和B一起工作来完成某个任务,必须有一个在两个进程间通信信息和时间的方法。我们这里可以去看看基本的进程组件。注意进程有一个文本、数据以及堆栈片断。进程可能也有从自由存储空间中分配的其它内存。进程所占有的数据一般位于数据片断、堆栈片断或进程的动态分配内存中。数据对于其它进程来说是受保护的。为了让一个进程访问另外一个进程的数据,必须最终使用操作系统调用。与之类似,为了让一个进程知道另一个进程中文本片断中发生的事件,必须在进程间建立一种通信方式。这也需要来自操作系统API的帮助。当进程将数据发送到另一进程时,称做IPC(interprocess communication,进程间通信)。
下面先列举几种不同类型的进程间通信方式:
进程间通信 | 描述 |
环境变量/文件描述符 | 子进程接受父进程环境数据的拷贝以及所有文件描述符。父进程可以在它的数据片断或环境中设置一定的变量,同时子进程接收这些值。父进程可以打开文件,同时推进读/写指针的位置,而且子进程使用相同的偏移访问该文件。 |
命令行参数 | 在调用exec或派生函数期间,命令行参数可以传递给子进程。 |
管道 | 用于相关和无关进程间的通信,而且形成两个进程间的一个通信通道,通常使用文件读写程序访问。 |
共享内存(动态数据交换,Dynamic data exchange) |
使用客户机/服务器模型(C/S),服务器对客户的数据
或动作请求作出反应。 |
DDE | 两个进程之外的内存块,两个进程均可以访问它。 |
一、环境变量、文件描述符:
当创建一个子进程时,它接受了父进程许多资源的拷贝。子进程接受了父进程的文本、堆栈
以及数据片断的拷贝。子进程也接受了父进程的环境数据以及所有文件描述符的拷贝。子进
程从父进程继承资源的过程创造了进程间通信的一个机会。父进程可以在它的数据片断或环
境中设置一定的变量,子进程于是接受这些值。同样,父进程也可以打开一个文件,推进到
文件内的期望位置,子进程接着就可以在父进程离开读/写指针的准确位置访问该文件。
这类通信的缺陷在于它是单向的、一次性的通信。也就是说,除了文件描述外,如果子进程
继承了任何其它数据,也仅仅是父进程拷贝的所有数据。 一旦创建了子进程,由子进程对
这些变量的任何改变都不会反映到父进程的数据中。同样,创建子进程后,对父进程数据的
任何改变也不会反映到子进程中。所以,这种类型的进程间通信更像指挥棒传递。一旦父进
程传递了某些资源的拷贝,子进程对它的使用就是独立的,必须使用原始传递资源。
二、命令行参数:
通过命令行参数(command-line argument)可以完成另一种单向、一次性的进程间通信
我前面的文章已经提到过使用命令行参数。命令行参数在调用一个exec或派生调用操作系
统时传递给子进程。命令行参数通常在其中一个参数中作为NULL终止字符串传递给exec
或派生函数调用。这些函数可以按单向、一次性方式给子进程传递值。WINDOWS有调用执行
exe程序的API。大家可以去参考一下ShellExecuteA函数相关。
三、管道通信:
继承资源以及命令行参数是最简单形式的进程间通信。它们同时有两个主要限制。除了文件
描述符外,继承资源是IPC的单向、一次性形式。传递命令参数也是单向、一次性的IPC
方法。这些方法也只有限制于关联进程,如果不关联,命令行参数和继承资源不能使用。还
有另一种结构,称做管道(Pipe),它可以用于在关联进程间以及无关联进程间进行通信。
管道是一种数据结构,像一个序列化文件一样访问。它形成了两个进程间的一种通信渠道。
管道结构通过使用文本和写方式来访问。如果进程A希望通过管道发送数据给进程B,那么
进程A向管道写入数据。为了让进程B接收此数据,进程B必须读取管道,与命令行参数的
IPC形式不一样。管道可以双向通信。两进程间的数据流是双向通信的。管道可以在程序的
整个执行期间使用,在进程间发送和接收数据。所以,管道充当可访问管道的进程间的一种
可活链接,有两种基本管道类型:
1. 匿名管道
2. 命名管道
上面的图可以看出在没有管道时,两进程是不能互写的。
建立管道后就可以相互通信了。
四、 共享内存
共享内存也可以实现进程间的通信。进程需要可以被其他进程浏览的内存块。希望访问这个内存块的其他进程请求对它的访问,或由创建它的进程授予访问内存块的权限。可以访问特定内存块的所有进程对它具有即时可见性。共享内存被映射到使用它的每个进程的地址空间。所以,它看起来像是另一个在进程内声明的变量。当一个进程写共享内存,所有的进程都立即知道写入的内容,而且可以访问。
进程间共享内存的关系与函数间全局变量的关系相似。程序中的所有函数都可以使用全局变量的值。同样,共享内存块可以被正在执行的所有进程访问。内存块可能共享一个逻辑地址,进程也可以共享某些物理地址。
共享内存块的创建必须由一个系统API调用来完成。在WIN32环境中,使用CreateFileMapping()、MapViewOfFile()以及MapViewOfFileEx() API能很好地完成。
共享内存分配位于WIN32系统中2~3GB地址范围内。一旦调用MapViewOfFile()和MapViewOfFileEx(),共享文件映射对象的所有进程都可以立即访问此内存块,而且在需要时,可以读写此内存块。
五、动态数据交换
动态数据交换( dynamic data exchange ) 是当今可用的进程间通信最强大和完善的形式之一。动态数据交换使用消息传递、共享内存、事务协议、客户/服务器范畴、同步规则以及会话协议来让数据和控制信息在进程间流动。动态数据交换对话( dynamic data exchange session, DDE )的基本模型是客户、服务器。服务器对来自客户的数据或动作作出反应。客户和服务器可以以多种关系来通信。
一个服务器可以与任意数量的客户通信。一个客户也可以与任意数量的服务器通信。单个DDE代理既可以是客户,也可以是服务器。也就是说,进程可以从一个正为另一个进程执行服务的DDE代理请求服务。
下部分参考文献1:
进程间通信主要包括管道, 系统IPC(包括消息队列,,共享存储), SOCKET.
Windows系统进程间通信
Windows提供了多种机制,使得应用程序之间能够快速、方便地共享数据和信息。这些机制包括RPC、COM、OLE、DDE、消息、剪切板、邮件槽、管道、套接字等。但是,如果在同一台机器上的多个进程间进行通信的话,那么上面的机制都与共享内存有关。这在Windows上称作内存映射文件。
这种数据共享机制是通过让两个或多个进程映射同一文件映射对象的视图来实现,这意味着进程间共享相同的物理存储页面。因此,当一个进程在文件映射对象的视图中写入数据时,其他的进程会在它们的视图中立刻看到变化。但是,对多个进程共享同一个文件映射对象来说,所有进程使用的文件映射对象的名称必须完全相同[1]。
Linux系统进程间通信
linux下的进程通信手段基本上是从Unix平台上的进程通信手段继承而来的。而对Unix发展做出重大贡献的两大主力AT&T的贝尔实验室及BSD(加州大学伯克利分校的伯克利软件发布中心)在进程间通信方面的侧重点有所不同。前者对Unix早期的进程间通信手段进行了系统的改进和扩充,形成了“system V IPC”,通信进程局限在单个计算机内;后者则跳过了该限制,形成了基于套接口(socket)的进程间通信机制。Linux则把两者继承了下来。
Linux下的进程间通信机制大致包括:管道、信号(在Windows上成为消息)、信号队列(实际是消息链表)、共享内存、信号量、套接字。
共同点
由上面的分析可以看出两个操作系统共有的且用的较多的进程间通信机制有:管道、消息、共享内存和套接字。简介如下:
管道(Pipe)及有名管道(named pipe):管道可用于具有亲缘关系进程间的通信,有名管道克服了管道没有名字的限制,因此,除具有管道所具有的功能外,它还允许无亲缘关系进程间的通信。
信号或者消息(Signal):信号是比较复杂的通信方式,用于通知接受进程有某种事件发生,除了用于进程间通信外,进程还可以发送信号给进程本身。
共享内存:使得多个进程可以访问同一块内存空间,是最快的可用IPC形式。是针对其他通信机制运行效率较低而设计的。往往与其它通信机制,如信号量结合使用,来达到进程间的同步及互斥。
套接口(Socket):更为一般的进程间通信机制,可用于不同机器之间的进程间通信。
总结
消息队列是消息的链接表,消息队列克服了信号承载信息量少,管道只能承载无格式字节流以及缓冲区大小受限等缺点;而信号量主要作为进程间以及同一进程不同线程之间的同步手段。
个人认为:管道、剪贴板、共享内存都是基于共享内存的方式。而消息、消息队列和套接字的都是基于发消息的机制,只是看是在同一个机器上发还是在网络中发消息而已(套接字可以看做在网络中发送消息)。至于RPC、COM、OLE、DDE主要是在客户端和服务器端生成一个统一的接口。也就是说这几个通信手段其实就相当于网络上的协议。在同一层通信的协议不管下一层,好像这两层直接建立了联系。这个基本的思想是在本地建立类似存根代码的代码,而在远程建立类似桩代码的代码来进行连接。
这上面的通信方式中,剪切板和匿名管道只能实现同一机器上两个进程间的通信,而信号量、消息、消息队列和共享内存也只能在同一台机器上的多个进程间通信;但是命名管道、邮件槽和套接字不仅可以实现同一机器上的两个进程的通信,还可以实现跨网络的进程间通信;另外,油槽和套接字可以实现一对多的通信,而命名管道只能是点对点的单一通信,但油槽的缺点是数据量较小,通常都是在424字节以下,如果数据量较大,则可以采用命名管道和套接字的方式来完成。综上:在跨网络通信中套接字无疑是最优秀的通信方式,这或许是伯克利开发套接字来进行网络通信的初衷吧(传统通信方式不好用)。