Cache性能-sunupzhou-ChinaUnix博客

sunupzhou的ChinaUnix博客sunupzhou.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

sunupzhou

博客访问： 37962
博文数量： 11
博客积分： 265
博客等级：二等列兵
技术积分： 130
用户组：普通用户
注册时间： 2012-09-03 12:48

文章分类

全部博文（11）

文章存档

2012年（11）

我的朋友

相关博文

Cache性能

分类：服务器与存储

2012-09-11 10:34:50

平均存储器访问时间:

平均存储器访问时间=命中时间+缺失率*缺失代价

命中时间为cache命中时间

(1)平均存储器访问时间和处理器性能

假定所有的存储器停顿都是由cache缺失引起的.

cache命中的时钟周期数应该被认为是CPU执行时钟,命中时钟周期数包含在CPU执行时钟周期数中

cache的行为对于处理器的性能影响:

CPI表示每条指令执行的时钟数

CPI越低，一定的cache缺失时钟数对CPU时间的相对影响越大

在计算CPI时(考虑到cache缺失的),cache缺失代价用缺失时花费的处理器时钟周期数来度量

对于两台计算机存储层次结构相同，时钟频率较高的处理器，每次缺失会花费较多的周期.

cache对于具有低CPI和高时钟频率处理器的性能影响更为重要.

最终目标是:降低处理器执行时间

(2)缺失代价和乱序执行处理器

全部缺失延迟：没有竞争的延迟和有竞争的延迟

两个问题:

(i)在乱序处理器中，如何确定存储器操作的开始和结束时刻?

(ii)如何确定处理器中重叠的开始时刻

如果在一个周期内处理器不能完成最大可能数目的指令，则称处理器在这个时钟周期内停顿.

5 基本的cache优化机制

cache性能的框架:

平均存储器访问时间=命中时间+缺失率*缺失代价

将cache的优化策略归结为三类:
(1)降低缺失率，增大块容量，增加相联度

(2)减少缺失代价,多级cache，读缺失优先于写

(3)减少cache命中时间,避免索引时候的地址转换

降低缺失率的方法:

强制缺失:对一个块的第一次访问一定不在cache中，所以该块必须被调入到cache中,也叫冷启动缺失或者首次访问缺失
容量缺失:cache容纳不了一个程序执行所需的所有的块，将会发生容量缺失,某些块被丢弃，随后再次被调入
冲突缺失:在直接映射与组相联中，有太多块被映射到同一个组中，则某一块呗丢弃，随后再次被调入

解决冲突缺失:

全相联能够解决冲突缺失,但是硬件昂贵，而且使得处理器的时钟频率变的很慢，导致系统的总性能降低.

解决容量缺失:

增大cache容量,若上层的存储器比程序所需要的空间小很多，则在层次结构之间传输数据会耗费很长时间,这个就是存储器之间出现的抖动现象

减少强制缺失:

增大块容量,若块大小发生改变，则会发生冲突缺失.

多级cache来降低缺失代价:

第一级cache可以小到足以与快速的处理器运行的时钟周期时间相匹配

第二级cache能够足够大到足以捕捉到对内存进行的大多数访问,从而有效的减少缺失代价

两级cache的平均存储器访问时间:

平均存储器访问时间=命中时间(L1)+缺失率(L1)*(命中时间(L2)+缺失率(L2)*缺失代价(L2))

局部缺失率：一级cache的缺失数除以cache的存储器访问总数，在一级cache中等于缺失率L1，在二级cache中，它等于缺失率L2

全局缺失率:一级cache的全局缺失率仍为缺失率L1，二级cache的全局缺失率为缺失率(L1)*缺失率(L2)

二级cache的局部缺失率比较大，一级cache存储的是最易命中的数据

二级cache比一级cache大很多时，全局cache缺失率与二级cache缺失率非常接近，二级cache局部缺失率是一级cache局部缺失率的一个函数，它将随着一级cache的变化而变化

全局cache缺失率才是更好的判断标准

一级cache的速度影响cpu的时钟频率，二级cache的速度仅仅影响一级cache的缺失代价

二级cache的容量:

一级cache的所有信息都可能会出现在二级cache上，二级cache应该比一级cache大得多，若二级cache只是稍大一点，那么局部缺失率将会很高

一级的cache中的数据总是包含在二级cache中，多级包含是存储器层次结构的自然属性,I/O与cache之间的一致性，就能够通过检查二级cache来确定

多级独占:

一级cache中的数据都不在二级cache中

一级cache的缺失只会使一级cache和二级cache中的块进行交换，而不是替换.该方法防止二级cache容量的浪费.

阅读(3813) | 评论(0) | 转发(0) |

上一篇：fork()函数

下一篇：预取与cache机制的磁盘节能方案

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6