2012年(82)
分类: LINUX
2012-05-18 15:10:53
目录
1 信号量
1.1 通用信号量
1.2 互斥锁
1.3 读/写信号量
信号量
通用信号量
用户类进程之间使用信号量(semaphore)进行同步,内核线程之间也使用了信号量。信号量与自旋锁类似,保护临界区代
码。但信号量与自旋锁有一定的区别,信号量在无法得到资源时,内核线程处于睡眠阻塞状态,而自旋锁处于忙等待状态。因此,如果资源被占用时间很短时,使用
自旋锁较好,因为它可节约调度时间。如果资源被占用的时间较长,使用信号量较好,因为可让CPU调度去做其它进程的工作。
操作信号量的API函数说明如表6。
表6 信号量API函数功能说明
函数定义 功能说明
sema_init(struct semaphore *sem, int val) 初始化信号量,将信号量计数器值设置val。
down(struct semaphore *sem) 获取信号量,不建议使用此函数。
down_interruptible(struct semaphore *sem) 可被中断地获取信号量,如果睡眠被信号中断,返回错误-EINTR。
down_killable (struct semaphore *sem) 可被杀死地获取信号量。如果睡眠被致命信号中断,返回错误-EINTR。
down_trylock(struct semaphore *sem) 尝试原子地获取信号量,如果成功获取,返回0,不能获取,返回1。
down_timeout(struct semaphore *sem, long jiffies) 在指定的时间jiffies内获取信号量,若超时未获取,返回错误-ETIME。
up(struct semaphore *sem) 释放信号量sem。
样例:信号量的使用
下面函数do_utimes利用信号量防止多个线程对文件系统节点inode同时进行访问。其列出如下(在fs/open.c中):
long do_utimes(char __user * filename, struct timeval * times)
{
struct inode * inode;
……
down(&inode->i_sem); //获取信号量
error = notify_change(nd.dentry, &newattrs);//修改inode中值
up(&inode->i_sem); //释放信号量
……
}
下面说明信号量API函数。
(1)信号量结构semaphore
信号量用结构semaphore描述,它在自旋锁的基础上改进而成,它包括一个自旋锁、信号量计数器和一个等待队列。用户程序只能调用信号量API函数,而不能直接访问信号量结构,其列出如下(在include/linux/semaphore.h中):
struct semaphore {
spinlock_t lock;
unsigned int count;
struct list_head wait_list;
};
(2)初始化函数sema_init
函数sema_init初始化信号量,将信号量值初始化为n,其列出如下:
static inline void sema_init(struct semaphore *sem, int val)
{
static struct lock_class_key __key;
*sem = (struct semaphore) __SEMAPHORE_INITIALIZER(*sem, val);
/*初始化一个锁的实例,用于调试中获取信号量的调试信息*/
lockdep_init_map(&sem->lock.dep_map, "semaphore->lock", &__key, 0);
}
#define __SEMAPHORE_INITIALIZER(name, n) /
{ /
.lock = __SPIN_LOCK_UNLOCKED((name).lock), / //初始化自旋锁
.count = n, / //将信号量计数器赋值为n
.wait_list = LIST_HEAD_INIT((name).wait_list), / //初始化等待队列
}
(3)可中断获取信号量函数down_interruptible
函数down_interruptible获取信号量,存放在参数sem中。它尝试获取信号量,如果其他线程被允许尝试获取此信号量,则将本线程睡眠等待。如果有一个信号中断睡眠,则它返回错误-EINTR。如果成功获取信号量,函数返回0。
函数down_interruptible列出如下(在kernel/semaphore.c中):
int down_interruptible(struct semaphore *sem)
{
unsigned long flags;
int result = 0;
spin_lock_irqsave(&sem->lock, flags); //获取自旋锁,关闭中断,将状态寄存器值存放在flags
/*如果信号量计数器值大于0,说明有多个空闲资源可访问,可以成功获取信号量了*/
if (likely(sem->count > 0)) //likely表示成功获取的概率大,通知编译器进行分支预测优化
sem->count--;
else
result = __down_interruptible(sem); //进入睡眠等待
spin_unlock_irqrestore(&sem->lock, flags);
return result;
}
static noinline int __sched __down_interruptible(struct semaphore *sem)
{
return __down_common(sem, TASK_INTERRUPTIBLE, MAX_SCHEDULE_TIMEOUT);
}
函数__down_common进入睡眠等待,其列出如下:
static inline int __sched __down_common(struct semaphore *sem, long state, long timeout)
{
struct task_struct *task = current;
struct semaphore_waiter waiter;
list_add_tail(&waiter.list, &sem->wait_list); //加入到等待队列
waiter.task = task;
waiter.up = 0;
for (;;) {
if (state == TASK_INTERRUPTIBLE && signal_pending(task))
goto interrupted;
if (state == TASK_KILLABLE && fatal_signal_pending(task))
goto interrupted;
if (timeout <= 0)
goto timed_out;
__set_task_state(task, state);
spin_unlock_irq(&sem->lock);
timeout = schedule_timeout(timeout); //调度
spin_lock_irq(&sem->lock);
if (waiter.up)
return 0;
}
timed_out:
list_del(&waiter.list);
return -ETIME;
interrupted:
list_del(&waiter.list);
return -EINTR;
}
(3)释放信号量函数up
函数up在没有其他线程等待使用信号量的情况下释放信号量,否则,唤醒其他等待线程。其列出如下:
void up(struct semaphore *sem)
{
unsigned long flags;
spin_lock_irqsave(&sem->lock, flags);
/*判断是否有线程等待在此信号量上,即判断等待队列是否为空*/
if (likely(list_empty(&sem->wait_list)))
/*没有线程等待此信号量,释放信号量,将信号量计数器加1,表示增加了1个空闲资源*/
sem->count++;
else
__up(sem); /*将本线程从等待队列删除,唤醒等待此信号量的其他线程*/
spin_unlock_irqrestore(&sem->lock, flags);
}
static noinline void __sched __up(struct semaphore *sem)
{
struct semaphore_waiter *waiter = list_first_entry(&sem->wait_list,
struct semaphore_waiter, list);
list_del(&waiter->list); //将本线程从等待队列删除
waiter->up = 1;
wake_up_process(waiter->task); //唤醒等待此信号量的其他线程
}
互斥锁
信号量的初始值表示可以有多少个任务可同时访问的共享资源,如果初始值为1,表示只有1个任务可以访问,信号量变成互斥锁(Mutex)。可见互斥锁是信号量的特例。
互斥锁(mutex)是在原子操作API的基础上实现的信号量行为。互斥锁不能进行递归锁定或解锁,能用于交互上下文,同一时间只能有一个任务持有互斥锁。
互斥锁功能上基本上与信号量一样,互斥锁占用空间比信号量小,运行效率比信号量高。互斥锁的API函数功能说明如表1。
表1 互斥锁的API函数功能说明
API函数 功能说明
DEFINE_MUTEX(mutexname) 创建和初始化互斥锁。
void mutex_lock(struct mutex *lock); 加锁。
void mutex_unlock(struct mutex *lock); 解锁。
int mutex_trylock(struct mutex *lock); 尝试加锁。
互斥锁用结构mutex描述,它含有信号量计数和等待队列成员,信号量的值为1或0或负数。其列出如下(在include/linux/mutex.h中):
struct mutex {
/* 1:表示解锁,0:表示锁住,负数:表示锁住,可能有等待者*/
atomic_t count;
spinlock_t wait_lock; /*操作等待队列的自旋锁*/
struct list_head wait_list; /*等待队列*/
/*省略了用于调试的结构成员*/
};
读/写信号量
读/写信号量适于在读多写少的情况下使用。如果一个任务需要读和写操作时,它将被看作写者,在不需要写操作的情况下可降级为读者。任意多个读者可同时拥有一个读/写信号量,对临界区代码进行操作。
在
没有写者操作时,任何读者都可成功获得读/写信号量进行读操作。如果有写者在操作时,读者必须被挂起等待直到写者释放该信号量。在没有写者或读者操作时,
写者必须等待前面的写者或读者释放该信号量后,才能访问临界区。写者独占临界区,排斥其他的写者和读者,而读者只排斥写者。
读/写信号量可通过依赖硬件架构或纯软件代码两种方式实现。下面只说明纯软件代码实现方式。
(1)API说明
用户可通过调用读/写信号量API实现读/写操作的同步。读/写信号量API说明如表1。
表1 读/写信号量API函数功能说明
API函数定义 功能说明
DECLARE_RWSEM(name) 声明名为name的读写信号量,并初始化它。
void init_rwsem(struct rw_semaphore *sem); 对读写信号量sem进行初始化。
void down_read(struct rw_semaphore *sem); 读者用来获取sem,若没获得时,则调用者睡眠等待。
void up_read(struct rw_semaphore *sem); 读者释放sem。
int down_read_trylock(struct rw_semaphore *sem); 读者尝试获取sem,如果获得返回1,如果没有获得返回0。可在中断上下文使用。
void down_write(struct rw_semaphore *sem); 写者用来获取sem,若没获得时,则调用者睡眠等待。
int down_write_trylock(struct rw_semaphore *sem); 写者尝试获取sem,如果获得返回1,如果没有获得返回0。可在中断上下文使用
void up_write(struct rw_semaphore *sem); 写者释放sem。
void downgrade_write(struct rw_semaphore *sem); 把写者降级为读者。
(2)读/写信号量结构rw_semaphore
读/写信号量结构rw_semaphore描述了读/写信号量的值和等待队列,其列出如下(在include/linux/rwsem-spinlock.h中):
struct rw_semaphore {
/*读/写信号量定义:
* - 如果activity为0,那么没有激活的读者或写者。
* - 如果activity为+ve,那么将有ve个激活的读者。
* - 如果activity为-1,那么将有1个激活的写者。 */
__s32 activity; /*信号量值*/
spinlock_t wait_lock; /*用于锁等待队列wait_list*/
struct list_head wait_list; /*如果非空,表示有进程等待该信号量*/
#ifdef CONFIG_DEBUG_LOCK_ALLOC /*用于锁调试*/
struct lockdep_map dep_map;
#endif
};
(3)读者加锁/解锁操作实现分析
1)加读者锁操作
读者加锁函数down_read用于加读者锁,如果没有写者操作时,等待队列为空,读者可以加读者锁,将信号量的读者计数加1。如果有写在操作时,等待队列非空,读者需要等待写者操作完成。函数down_read列出如下(在kernel/rwsem.c中):
void __sched down_read(struct rw_semaphore *sem)
{
might_sleep(); /*用于调试自旋锁睡眠*/
rwsem_acquire_read(&sem->dep_map, 0, 0, _RET_IP_); /*确认获得锁,用于调试*/
/*跟踪锁状态信息(如:锁深度),用于调试*/
LOCK_CONTENDED(sem, __down_read_trylock, __down_read);
}
函数__down_read 完成加读者的具体操作,其列出如下(在lib/rwsem-spinlock.c中):
void __sched __down_read(struct rw_semaphore *sem)
{
struct rwsem_waiter waiter;
struct task_struct *tsk;
spin_lock_irq(&sem->wait_lock);
/*如果有0或多个读者,并且等待队列为空,就可以获取sem*/
if (sem->activity >= 0 && list_empty(&sem->wait_list)) {
/* 获得sem */
sem->activity++; /*读者计数加1*/
spin_unlock_irq(&sem->wait_lock);
goto out;
}
/*运行到这里,说明不能获取sem,将当前进程加入等待队列进行等待*/
tsk = current;
set_task_state(tsk, TASK_UNINTERRUPTIBLE);
/* 建立等待队列成员*/
waiter.task = tsk;
waiter.flags = RWSEM_WAITING_FOR_READ; /*表示等待读操作*/
get_task_struct(tsk); /*进程使用计数加1*/
list_add_tail(&waiter.list, &sem->wait_list); /*将等待成员加到等待队列尾*/
/* 不再需要访问等待队列,因此,这里解锁*/
spin_unlock_irq(&sem->wait_lock);
/* 读者等待获取sem */
for (;;) {
if (!waiter.task)
break;
schedule();
set_task_state(tsk, TASK_UNINTERRUPTIBLE);
}
/*运行这里,退出等待,说明可以获取sem了*/
tsk->state = TASK_RUNNING;
out:
;
}
2)解读者锁操作
函数up_read释放读者锁,如果等待队列非空,说明有写者在等待,就从等待队列唤醒一个写者。其列出如下(在kernel/rwsem.c中):
void up_read(struct rw_semaphore *sem)
{
rwsem_release(&sem->dep_map, 1, _RET_IP_); /*获取解锁信息,用于调试*/
__up_read(sem);
}
函数__up_read是释放读者锁的具体操作函数,其列出如下:
void __up_read(struct rw_semaphore *sem)
{
unsigned long flags;
spin_lock_irqsave(&sem->wait_lock, flags);
/*如果所有读者完成读操作,并且有写者等待,那么唤醒一个写者*/
if (--sem->activity == 0 && !list_empty(&sem->wait_list))
sem = __rwsem_wake_one_writer(sem);
spin_unlock_irqrestore(&sem->wait_lock, flags);
}
/*唤醒一个写者*/
static inline struct rw_semaphore *__rwsem_wake_one_writer(struct rw_semaphore *sem)
{
struct rwsem_waiter *waiter;
struct task_struct *tsk;
sem->activity = -1; /*表示有一个写者正在写操作*/
/*获取一个等待者*/
waiter = list_entry(sem->wait_list.next, struct rwsem_waiter, list);
list_del(&waiter->list); /*将该等待者从等待队列删除*/
tsk = waiter->task;
smp_mb(); /*加内存屏障,确保完成上面的指针引用操作*/
waiter->task = NULL;
wake_up_process(tsk); /*唤醒进程*/
put_task_struct(tsk); /*进程上下文使用计数减1*/
return sem;
}
(3)写者加锁/解锁操作实现分析
1)加写者锁操作
函数down_write完成加写者锁操作,其列出如下:
void __sched down_write(struct rw_semaphore *sem)
{
might_sleep();
rwsem_acquire(&sem->dep_map, 0, 0, _RET_IP_);
LOCK_CONTENDED(sem, __down_write_trylock, __down_write);
}
void __sched __down_write(struct rw_semaphore *sem)
{
__down_write_nested(sem, 0);
}
函数__down_write_nested完成加写者锁的具体操作。当没有读者或写者操作时,写者才可以获取写者锁。写者锁是独占的。如果有其他写者或读者操作时,写者必须等待。其列出如下:
void __sched __down_write_nested(struct rw_semaphore *sem, int subclass)
{
struct rwsem_waiter waiter;
struct task_struct *tsk;
spin_lock_irq(&sem->wait_lock);
/*如果没有读者,并且等待队列为空(说明没有写者)时,写者才能获取写者锁*/
if (sem->activity == 0 && list_empty(&sem->wait_list)) {
/* 获取写者锁*/
sem->activity = -1;
spin_unlock_irq(&sem->wait_lock);
goto out;
}
/*运行到这里,说明有读者或写者在操作,需要等待*/
tsk = current;
set_task_state(tsk, TASK_UNINTERRUPTIBLE);
/* 建立等待队列成员*/
waiter.task = tsk;
waiter.flags = RWSEM_WAITING_FOR_WRITE; /*标识为等待写操作*/
get_task_struct(tsk); /*进程上下文使用计数加1*/
list_add_tail(&waiter.list, &sem->wait_list); /*加到等待队列尾*/
spin_unlock_irq(&sem->wait_lock);
/* 进行等待*/
for (;;) {
if (!waiter.task)
break;
schedule();
set_task_state(tsk, TASK_UNINTERRUPTIBLE);
}
/*被唤醒*/
tsk->state = TASK_RUNNING;
out:
;
}
2)解写者锁操作
函数up_write释放写者锁,将读者计数设置为0,其列出如下:
void up_write(struct rw_semaphore *sem)
{
rwsem_release(&sem->dep_map, 1, _RET_IP_);
__up_write(sem);
}
void __up_write(struct rw_semaphore *sem)
{
unsigned long flags;
spin_lock_irqsave(&sem->wait_lock, flags);
sem->activity = 0; /*表示有0个读者*/
if (!list_empty(&sem->wait_list))
sem = __rwsem_do_wake(sem, 1); /*唤醒等待者*/
spin_unlock_irqrestore(&sem->wait_lock, flags);
}