当解决多线程互斥同步的问题时,经常会有如下几个问题:
1. 在一个给定的问题中,需要多少个Mutex,多少个Semaphore?有什么规律?
2. 在对临界区加锁和等待信号量的顺序上有什么要求和规律?
3. 什么样操作适合放在临界区,什么样的不适合?
下面就生产者和消费者问题来分析一些这几个问题.
下面是一个简单的实现程序:
生产者向数组sharedArray中写入数据,而消费者从该数组中读取数据.
#include #include #include #include
#define MAXSIZE 5 /*共享缓冲区的大小*/
int sharedArray[MAXSIZE]; /*sharedArray是共享缓冲区*/ int curr=-1; /*curr是用来指定sharedArray当前存有数据的最大位置*/ /*注意,sharedArray和curr都属于共享数据*/
int empty=0; int full=MAXSIZE; pthread_mutex_t sharedMutex=PTHREAD_MUTEX_INITIALIZER; /*锁定临界区的mutex*/ sem_t waitNonEmpty, waitNonFull; /*等待"非空资源"和等待"非满资源"的semaphor*/
void * readData(void * whichone) { int data, position; while (1){ sem_wait(&waitNonEmpty); /*是否有"非空资源"*/
pthread_mutex_lock(&sharedMutex); /*进入临界区*/ data = sharedArray[curr]; position = curr--; printf ("%s read from the %dth: %d, \n", (char*)whichone, position, data); sem_post(&waitNonFull); /*生成一个"非满资源"*/ pthread_mutex_unlock(&sharedMutex); /*离开临界区*/
sleep(2); /*跟同步无关的费时操作*/ } }
void * writeData(void * whichone) { int data, position; while (1) { data=(int)(10.0*random()/RAND_MAX); /*生成一个随机数据,注意是10.0而不是10*/ sem_wait(&waitNonFull); /*是否有"非满资源"*/
pthread_mutex_lock(&sharedMutex); /*进入临界区*/ position = ++curr; sharedArray[curr]=data; printf ("%s wrote to the %dth: %d, \n", (char*)whichone, position, data); sem_post(&waitNonEmpty); /*生成一个"非空资源"*/ pthread_mutex_unlock(&sharedMutex); /*离开临界区*/
sleep(1); /*跟同步无关的费时操作*/
} }
int main (int argc, char** argv) { pthread_t consumer1, consumer2, producer1, producer2; /*两个生产者和两个消费者*/ sem_init(&waitNonEmpty, 0, empty); /*初始化信号量*/ sem_init(&waitNonFull, 0, full); /*注意,本问题中的两种semaphore是有一定关系的,那就是它们的初始值之和应该等于共享缓冲区大小*/ /*即empty+full等于MAXSIZE*/
pthread_create (&consumer1, NULL, &readData, "consumer1"); pthread_create (&consumer2, NULL, &readData, "consumer2"); pthread_create (&producer1, NULL, &writeData, "producer1"); pthread_create (&producer2, NULL, &writeData, "producer2"); pthread_join (consumer1, NULL); pthread_join (consumer2, NULL); pthread_join (producer1, NULL); pthread_join (producer2, NULL); sem_destroy(&waitNonEmpty); sem_destroy(&waitNonFull);
} | 分析和说明:
1. 在一个给定的问题中,需要多少个Mutex,多少个Semaphore?有什么规律?
在本问题中,共需要一个Mutex和两个Semaphore.
其中,Mutex是用来锁定临界区的,以解决对共享数据的互斥访问问题(无论是对生成者还是对消费者);我们共需要两个Semaphore,这是因为在本问题中共有两个稀缺资源.
第一种是"非空"这种资源,是在消费者之间进行竞争的.
第二种是"非满"这种资源,是在生产者之间进行竞争的.
所以,一般来说,需要锁定临界区,就需要Mutex;有几种稀缺资源就需要几个Semaphore.对稀缺资源的分析不能想当然.稀缺资源不一定是指被共享的资源,很多时候是指线程会被阻塞的条件(除了要进临界区被阻塞外).本例中,消费者会在缓冲区为空时被阻塞,所以"非空"是一种稀缺资源;生产者会在缓冲区为满时被阻塞,所以"非满"也是一种稀缺资源.
2. 在对临界区加锁和等待信号量的顺序上有什么要求和规律?
这里要说两点: 第一,不要将等待信号量的语句放在被锁定的临界区内,这样会造成死锁.而且这也是很没有必要的.
比如,消费者在缓冲区没有数据的时候进入临界区,这样就会把临界区锁上,由于没有数据,消费者也会被锁上.
这时,任何生产者都会由于临界区被锁上而被block住,这样就造成了死锁.
第二,如果有多个Semaphore需要等待,那么每个线程中,最好对这多个信号量进行等待的顺序一致,不然的话很容易造成死锁.
3.什么样操作适合放在临界区,什么样的不适合?
一般来说,临界区中只放对共享数据进行访问的语句,这样会改善程序的性能.
很多时候,取出共享数据的副本后,对副本进行费时的各种操作就不需要放在临界区了.
比如,本例中的sleep语句就根本不需要放入临界区. | |