分类: LINUX
2011-05-26 12:45:56
从上看到,spin_lock的主要内容是spin_lock_string宏,定义如下:
#define spin_lock_string \ "\n1:\t" \ "lock ; decb %0\n\t" \ "js 2f\n" \ LOCK_SECTION_START("") \ "2:\t" \ "cmpb $0,%0\n\t" \ "rep;nop\n\t" \ "jle 2b\n\t" \ "jmp 1b\n" \ LOCK_SECTION_END
在上面的汇编代码中,首先将lock递减,如果为负(表明锁已被持有),则进入自旋。每次自旋在执行一条空指令后,根据lock和0的比较结果进行跳转。如果lock小于或等于0,则继续自旋;否则(说明锁已被释放),则将lock递减后返回。在这里,采取了一种优化手段,因为在大多数情况下,自旋锁是能成功获取的,而自旋部分代码,只是在锁被持有时才执行,因此利用LOCK_SECTION_START和LOCK_SECTION_END将这些代码放到一个专门的区(.text.lock)中。如果把它跟别的常用指令混在一起,会浪费指令缓存的空间。理解这一点,我们也就能明白spin_lock是如何退出的了。事实上,由于不再同一个区(section),所以"js 2f"的下一条指令并不是"cmpb $0,%0"。
#define LOCK_SECTION_NAME \ ".text.lock." __stringify(KBUILD_BASENAME)
#define LOCK_SECTION_START(extra) \ ".subsection 1\n\t" \ extra \ ".ifndef " LOCK_SECTION_NAME "\n\t" \ LOCK_SECTION_NAME ":\n\t" \ ".endif\n\t"
#define LOCK_SECTION_END \ ".previous\n\t"
如果用类C语言来描述上述过程,将是:void spin_lock(int &lock){ int flag;
label1: flag = lock--; if (flag >= 0) { return; } else { do { nop; } while(lock <= 0); goto label1; }}
当然,我们需要保证lock--为原子操作,就像在汇编中在decb指令前加上lock前缀一样。释放锁时使用spin_unlock_string宏,定义如下:
static inline void spin_unlock(spinlock_t *lock){ __asm__ __volatile__( spin_unlock_string );}
#define spin_unlock_string \ "movb $1,%0" \ :"=m" (lock->lock) : :
"memory"需要强调的是,为了和spin_lock相配合,我们在释放锁是必须将lock设置为1,而不能使用lock++的方式。
#define SPIN_LOCK_UNLOCKED (spinlock_t) { 1 SPINLOCK_MAGIC_INIT }
#define spin_lock_init(x) do { *(x) = SPIN_LOCK_UNLOCKED; } while(0)
#define spin_is_locked(x) (*(volatile signed char *)(&(x)->lock) <= 0)
#define spin_unlock_wait(x) do { barrier(); } while(spin_is_locked(x))
由于spin_trylock不需要自旋,实现中采用xchgb指令(该指令将自动锁总线,而不需要再使用lock前缀)。若lock原来的值为1,说明未上锁,因此返回为真,表明成功获得锁;否则返回为假。static inline int spin_trylock(spinlock_t *lock){ char oldval; __asm__ __volatile__( "xchgb %b0,%1" :"=q" (oldval), "=m" (lock->lock) :"0" (0) : "memory"); return oldval > 0;}
自旋锁的应用在讨论自旋锁的应用时,我们一般区分两种平台:单处理器非抢占式内核和对称多处理器或抢占式内核。在前面我们看到,在单处理器非抢占式内核下,自旋锁根本不存在。这体现了一种出色的设计策略,既然没有别人能够同时刻执行,就没有理由加锁。对于抢占式内核,我们将它等同于对称多处理器来考虑。
1. 用户上下文之间如果数据结构只可能被用户上下文访问,最高效的办法就是使用信号量。(我们在后面将讨论信号量机制)。
2. 用户上下文与softirq之间这种情况下,使用spin_lock_bh()/spin_unlock_bh()可以满足要求。如果是单处理器非抢占式内核,自旋锁消失了,spin_lock_bh等同于local_bh_disable,会进制在用户上下文时进制softirq,从而避免用户上下文和softirq同时进入临界区。如果是对称多处理器或者抢占式内核,即使是在不同CPU上的用户上下文和softirq同时运行,自旋锁机制保证了只有一个持有者,只有在它释放锁之后,另一个才能进入临界区。
3. 用户上下文和Tasklet/Timer之间同上。同加锁观点来看,Tasklet和Timer的地位是同样的。
4. Tasklet或Timer之间这里有两点需要说明:
(1)同一时刻,一个Tasklet或Timer不会同时在两个CPU上执行;
(2)如果CPU已经处在Tasklet或Timer中,它不会同时再执行其它的Tasklet或Timer。因此我们只需要考虑在不同CPU上运行两个不同Tasklet或Timer的情况,而这种情况只需要使用自旋锁机制,即spin_lock和spin_unlock函数。
5. Softirq之间或和Tasklet/Timer之间同一个softirq可能在不同的CPU上执行,同上道理,使用spin_lock和spin_unlock可以在不同CPU的同一个或不同softirq,或者Softirq与Tasklet或Timer之间保护共享数据。
6. 硬件中断之间如果被保护的共享资源在软中断(包括tasklet和timer)或进程上下文和硬中断上下文访问,那么在软中断或进程上下文访问期间,可能被硬中断打断,从而进入硬中断上下文对共享资源进行访问,因此,在进程或软中断上下文需要使用spin_lock_irq和spin_unlock_irq来保护对共享资源的访问。 而在中断处理句柄中使用什么版本,需依情况而定,如果只有一个中断处理句柄访问该共享资源,那么在中断处理句柄中仅需要spin_lock和spin_unlock来保护对共享资源的访问就可以了。 因为在执行中断处理句柄期间,不可能被同一CPU上的软中断或进程打断。但是如果有不同的中断处理句柄访问该共享资源,那么需要在中断处理句柄中使用spin_lock_irq和spin_unlock_irq来保护对共享资源的访问。在使用spin_lock_irq和spin_unlock_irq的情况下,完全可以用spin_lock_irqsave和spin_unlock_irqrestore取代,具体应该使用哪一个也需要依情况而定,如果可以确信在对共享资源访问前中断是打开的,那么使用spin_lock_irq更好一些,因为它比spin_lock_irqsave要快一些。但是如果不能确定是否中断使能,那么使用spin_lock_irqsave和spin_unlock_irqrestore更好,因为它将恢复访问共享资源前的中断标志而不是直接打开中断。 当然,有些情况下需要在访问共享资源时必须禁止中断,而访问完后必须打开中断,这样的情形使用spin_lock_irq和spin_unlock_irq最好
====
http://hi.baidu.com/greatren518/blog/item/f438df348c226eb3d1a2d346.html