这篇文章将讲述别一种进程间通信的机制——信号量。注意请不要把它与之前所说的信号混淆起来,信号与信号量是不同的两种事物。有关信号的更多内容,可以阅读我的另一篇文章:Linux进程间通信——使用信号。下面就进入信号量的讲解。
一、什么是信号量
为了防止出现因
多个程序同时访问一个共享资源而引发的一系列问题,我们需要一种方法,它可以通过生成并使用令牌来授权,在任一时刻只能有一个执行线程访问代码的临界区
域。临界区域是指执行数据更新的代码需要独占式地执行。而信号量就可以提供这样的一种访问机制,让一个临界区同一时间只有一个线程在访问它,也就是说信号
量是用来调协进程对共享资源的访问的。
信号量是一个特
殊的变量,程序对其访问都是原子操作,且只允许对它进行等待(即P(信号变量))和发送(即V(信号变量))信息操作。最简单的信号量是只能取0和1的变
量,这也是信号量最常见的一种形式,叫做二进制信号量。而可以取多个正整数的信号量被称为通用信号量。这里主要讨论二进制信号量。
二、信号量的工作原理
由于信号量只能进行两种操作等待和发送信号,即P(sv)和V(sv),他们的行为是这样的:
P(sv):如果sv的值大于零,就给它减1;如果它的值为零,就挂起该进程的执行
V(sv):如果有其他进程因等待sv而被挂起,就让它恢复运行,如果没有进程因等待sv而挂起,就给它加1.
举个例子,就是
两个进程共享信号量sv,一旦其中一个进程执行了P(sv)操作,它将得到信号量,并可以进入临界区,使sv减1。而第二个进程将被阻止进入临界区,因为
当它试图执行P(sv)时,sv为0,它会被挂起以等待第一个进程离开临界区域并执行V(sv)释放信号量,这时第二个进程就可以恢复执行。
三、Linux的信号量机制
Linux提供了一组精心设计的信号量接口来对信号进行操作,它们不只是针对二进制信号量,下面将会对这些函数进行介绍,但请注意,这些函数都是用来对成组的信号量值进行操作的。它们声明在头文件sys/sem.h中。
1、semget函数
它的作用是创建一个新信号量或取得一个已有信号量,原型为:
-
int semget(key_t key, int num_sems, int sem_flags);
第
一个参数key是整数值(唯一非零),不相关的进程可以通过它访问一个信号量,它代表程序可能要使用的某个资源,程序对所有信号量的访问都是间接的,程序
先通过调用semget函数并提供一个键,再由系统生成一个相应的信号标识符(semget函数的返回值),只有semget函数才直接使用信号量键,所
有其他的信号量函数使用由semget函数返回的信号量标识符。如果多个程序使用相同的key值,key将负责协调工作。
第二个参数num_sems指定需要的信号量数目,它的值几乎总是1。
第三个参数
sem_flags是一组标志,当想要当信号量不存在时创建一个新的信号量,可以和值IPC_CREAT做按位或操作。设置了IPC_CREAT标志后,
即使给出的键是一个已有信号量的键,也不会产生错误。而IPC_CREAT |
IPC_EXCL则可以创建一个新的,唯一的信号量,如果信号量已存在,返回一个错误。
semget函数成功返回一个相应信号标识符(非零),失败返回-1.
2、semop函数
它的作用是改变信号量的值,原型为:
-
int semop(int sem_id, struct sembuf *sem_opa, size_t num_sem_ops);
sem_id是由semget返回的信号量标识符,sembuf结构的定义如下:
-
struct sembuf{
-
short sem_num;
-
short sem_op;
-
-
short sem_flg;
-
-
};
3、semctl函数
该函数用来直接控制信号量信息,它的原型为:
-
int semctl(int sem_id, int sem_num, int command, ...);
如果有第四个参数,它通常是一个union semum结构,定义如下:
-
union semun{
-
int val;
-
struct semid_ds *buf;
-
unsigned short *arry;
-
};
前两个参数与前面一个函数中的一样,command通常是下面两个值中的其中一个
SETVAL:用来把信号量初始化为一个已知的值。p 这个值通过union semun中的val成员设置,其作用是在信号量第一次使用前对它进行设置。
IPC_RMID:用于删除一个已经无需继续使用的信号量标识符。
四、进程使用信号量通信
下面使用一个例
子来说明进程间如何使用信号量来进行通信,这个例子是两个相同的程序同时向屏幕输出数据,我们可以看到如何使用信号量来使两个进程协调工作,使同一时间只
有一个进程可以向屏幕输出数据。注意,如果程序是第一次被调用(为了区分,第一次调用程序时带一个要输出到屏幕中的字符作为一个参数),则需要调用
set_semvalue函数初始化信号并将message字符设置为传递给程序的参数的第一个字符,同时第一个启动的进程还负责信号量的删除工作。如果
不删除信号量,它将继续在系统中存在,即使程序已经退出,它可能在你下次运行此程序时引发问题,而且信号量是一种有限的资源。
在main函数中调用semget来创建一个信号量,该函数将返回一个信号量标识符,保存于全局变量sem_id中,然后以后的函数就使用这个标识符来访问信号量。
源文件为seml.c,代码如下:
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
#include
-
-
union semun
-
{
-
int val;
-
struct semid_ds *buf;
-
unsigned short *arry;
-
};
-
-
static int sem_id = 0;
-
-
static int set_semvalue();
-
static void del_semvalue();
-
static int semaphore_p();
-
static int semaphore_v();
-
-
int main(int argc, char *argv[])
-
{
-
char message = 'X';
-
int i = 0;
-
-
-
sem_id = semget((key_t)1234, 1, 0666 | IPC_CREAT);
-
-
if(argc > 1)
-
{
-
-
if(!set_semvalue())
-
{
-
fprintf(stderr, "Failed to initialize semaphore\n");
-
exit(EXIT_FAILURE);
-
}
-
-
message = argv[1][0];
-
sleep(2);
-
}
-
for(i = 0; i < 10; ++i)
-
{
-
-
if(!semaphore_p())
-
exit(EXIT_FAILURE);
-
-
printf("%c", message);
-
-
fflush(stdout);
-
sleep(rand() % 3);
-
-
printf("%c", message);
-
fflush(stdout);
-
-
if(!semaphore_v())
-
exit(EXIT_FAILURE);
-
sleep(rand() % 2);
-
}
-
-
sleep(10);
-
printf("\n%d - finished\n", getpid());
-
-
if(argc > 1)
-
{
-
-
sleep(3);
-
del_semvalue();
-
}
-
exit(EXIT_SUCCESS);
-
}
-
-
static int set_semvalue()
-
{
-
-
union semun sem_union;
-
-
sem_union.val = 1;
-
if(semctl(sem_id, 0, SETVAL, sem_union) == -1)
-
return 0;
-
return 1;
-
}
-
-
static void del_semvalue()
-
{
-
-
union semun sem_union;
-
-
if(semctl(sem_id, 0, IPC_RMID, sem_union) == -1)
-
fprintf(stderr, "Failed to delete semaphore\n");
-
}
-
-
static int semaphore_p()
-
{
-
-
struct sembuf sem_b;
-
sem_b.sem_num = 0;
-
sem_b.sem_op = -1;
-
sem_b.sem_flg = SEM_UNDO;
-
if(semop(sem_id, &sem_b, 1) == -1)
-
{
-
fprintf(stderr, "semaphore_p failed\n");
-
return 0;
-
}
-
return 1;
-
}
-
-
static int semaphore_v()
-
{
-
-
struct sembuf sem_b;
-
sem_b.sem_num = 0;
-
sem_b.sem_op = 1;
-
sem_b.sem_flg = SEM_UNDO;
-
if(semop(sem_id, &sem_b, 1) == -1)
-
{
-
fprintf(stderr, "semaphore_v failed\n");
-
return 0;
-
}
-
return 1;
-
}
运行结果如下:
注:这个程序的临界区为main函数for循环不的semaphore_p和semaphore_v函数中间的代码。
例子分析 :
同时运行一个程序的两个实例,注意第一次运行时,要加上一个字符作为参数,例如本例中的字符‘O’,它用于区分是否为第一次调用,同时这个字符输出到屏幕
中。因为每个程序都在其进入临界区后和离开临界区前打印一个字符,所以每个字符都应该成对出现,正如你看到的上图的输出那样。在main函数中循环中我们
可以看到,每次进程要访问stdout(标准输出),即要输出字符时,每次都要检查信号量是否可用(即stdout有没有正在被其他进程使用)。所以,当
一个进程A在调用函数semaphore_p进入了临界区,输出字符后,调用sleep时,另一个进程B可能想访问stdout,但是信号量的P请求操作
失败,只能挂起自己的执行,当进程A调用函数semaphore_v离开了临界区,进程B马上被恢复执行。然后进程A和进程B就这样一直循环了10次。
五、对比例子——进程间的资源竞争
看了上面的例
子,你可能还不是很明白,不过没关系,下面我就以另一个例子来说明一下,它实现的功能与前面的例子一样,运行方式也一样,都是两个相同的进程,同时向
stdout中输出字符,只是没有使用信号量,两个进程在互相竞争stdout。它的代码非常简单,文件名为normalprint.c,代码如下:
-
#include
-
#include
-
-
int main(int argc, char *argv[])
-
{
-
char message = 'X';
-
int i = 0;
-
if(argc > 1)
-
message = argv[1][0];
-
for(i = 0; i < 10; ++i)
-
{
-
printf("%c", message);
-
fflush(stdout);
-
sleep(rand() % 3);
-
printf("%c", message);
-
fflush(stdout);
-
sleep(rand() % 2);
-
}
-
sleep(10);
-
printf("\n%d - finished\n", getpid());
-
exit(EXIT_SUCCESS);
-
}
运行结果如下:
例子分析:
从上面的输出结
果,我们可以看到字符‘X’和‘O’并不像前面的例子那样,总是成对出现,因为当第一个进程A输出了字符后,调用sleep休眠时,另一个进程B立即输出
并休眠,而进程A醒来时,再继续执行输出,同样的进程B也是如此。所以输出的字符就是不成对的出现。这两个进程在竞争stdout这一共同的资源。通过两
个例子的对比,我想信号量的意义和使用应该比较清楚了。
六、信号量的总结
信号量是一个特
殊的变量,程序对其访问都是原子操作,且只允许对它进行等待(即P(信号变量))和发送(即V(信号变量))信息操作。我们通常通过信号来解决多个进程对
同一资源的访问竞争的问题,使在任一时刻只能有一个执行线程访问代码的临界区域,也可以说它是协调进程间的对同一资源的访问权,也就是用于同步进程的。
阅读(1139) | 评论(0) | 转发(0) |