全部博文(77)
分类: LINUX
2010-11-11 21:10:05
多核平台下,现有的单线程应用程序将逐步被多线程应用程序所取代,而有效的使用cache是构建高性能多线程应用程序的关键之一。然而,在多线程的程序中对于cache的不正确使用将严重影响系统性能。
cache使用中常见的一个问题是false sharing。当不同的线程同时读写同一cache line上不同数据时就可能发生false sharing。false sharing会导致多核处理器上严重的系统性能下降。
如在Intel Core 2 Duo处理器平台上, L2 cache是由两个core共享的而L1 data cache是分开的,由两个core分别存取。cache line的大小是64 Bytes。假定有一个全局数组int g[2]由2个线程A和B共享读写,该数组一共8个字节位于同一条cache line上。
经过2个线程的读操作,该cache line在两个L1 cache中将都处于shared状态。此时假设线程A改写了其中一个数组元素g[0],将使这个core上的这条cache line将变为modified状态, 而另外一个core上的对应的cache line将变成invalid状态,此时若线程B马上读取g[1],为了确保cache一致性,这条cache line的更新数据必须被传输到所需数据的那个core上。若读写的次数频繁,将增大cache miss的次数,严重影响系统性能。
解决false sharing问题的方法:
1. 增大数组元素的间隔使得由不同线程存取的元素位于不同的cache line上
2. 在每个线程中创建全局数组各个元素的本地拷贝,然后结束后再写回全局数组false sharing是多线程程序开发的常见问题,需要引起程序员们的重视。