TLBs,页结构cache和无效协议阅读总结-humjb

腾讯云成都招虚拟化内核工程师

首页　| 　博文目录　| 　关于我

humjb_1983

博客访问： 1268161
博文数量： 122
博客积分： 0
博客等级：民兵
技术积分： 4004
用户组：普通用户
注册时间： 2014-02-20 08:27

文章分类

全部博文（122）

硬件相关（13）
虚拟化（12）

XEN（1）

KVM（8）
其他（3）
Linux其他方面（4）
Linux内核（90）

中断相关（2）

代码相关（1）

内核其它（2）

引导和启动（1）

内核同步（2）

内核分析案例和方（21）

3.10内核源码分析（25）

文件系统（0）

调度和时钟（4）

PCI和设备相关（7）

网络相关（5）

内存管理（13）
未分配的博文（0）

文章存档

2016年（1）

2015年（21）

2014年（100）

我的朋友

相关博文

TLBs,页结构cache和无效协议阅读总结

分类： LINUX

2014-03-11 12:51:53

原文地址：TLBs,页结构cache和无效协议阅读总结作者：liujunwei1234

TLBs, Paging-Structure Caches, and Their Invalidation

(intel 手册阅读总结)
一地址转换
1 处理器是通过“分页机制”实现的线性地址到物理地址的转换，这些转换主要包括：
(1)指令的获取和普通数据的访问
(2)推测执行的预取和内存访问（这部分并不在代码的执行路径中,也不会引起缺页异常）
”分页机制“的执行主要由分页模型决定，下面我们就来看一下主要的分页模型：
(1)CR4.PAE = 0,此时将32位的线性地址转换为32的物理地址，当开启大页模式时，也可以把32位线性地址转换成36位的物理地址
（2）CR4.PAE = 1 and IA32_EFER MSR.LMA =0，此时将32位的线性地址转换成36位的物理地址
（3）CR4.PAE = 1 and IA32_EFER MSR.LMA =1,此时将48位的线性地址转换成52位的物理地址
2 Paging in IA-32e Mode

图中63-48位是第47位的符号扩展，CR3中存储的是PML4 table的物理地址，那么整个寻址的过程如下：
CR3 ＋ PML4 确定PML4 table中的某一项，512=2^9，所以只有一个PML4 table
CR3 ＋ PML4 ＋ Directory Ptr 确定页目录项中的某一项，同理，也只有一个页目录项表
CR3 ＋ PML4 ＋ Directory Ptr ＋ Directory 确定某一个页表项，也只有一个页表项表
CR3 ＋ PML4 ＋ Directory Ptr ＋ Directory ＋ table 确定某一个也表，也只有一个也表
最后加上便宜就可以得到相应的物理地址。
注意：每一级的表中都是512项，每一项是一个64位的入口
另外，在每一个入口的64位中除了52位的物理地址，还有一些其他的标志位：
（1）present: 标识包含访问物理地址的页框是否在内存中
（2）read/write: 读写权限位
（3）user/supervisor: 用户／内核访问权限位
（4）access：是否被访问，1表示被访问过
（5）dirty:是否被写过， 1 表示被写过
（6）resevred:这些位必须被设为0,否则将产生page fault
（7）Execute-disable：1 正常 0产生page fault

3 Translation Lookaside Buffers (TLBs)
先给出自己理解的TLBs,如果有错，敬请斧正。

每次寻址时，首先比较线性地址的也号是否在TLBs中，如果在直接取其物理地址，否则，进行其他的地址转换步骤。对于TLBs感觉从这个表中就可以理解了，这里就不在罗嗦了！

4 Paging-Structure Caches
现在我们再来看看，如果TLBs不命中的时候的地址转换方式,三种cache：
PML4 cache,PDE cache和PTE cache.
顾名思义，上面这些cache就是用来缓存以前相应的级别的线性地址转换的结果的，这没有什么好讲的，另一方面，采用这种机制无非也是想加快线性地址到物理地址的转换，使得以前的转换结果可以得到最大可能的利用。那么，寻址的过程就变成了这么一个顺序：
如果在TLBs中没有命中，就到PTE cache中查找，找到，直接就取得相应页表的物理地址，如果不命中，就到上一级的PDE cache中查找，一次类推，直到到达PML4 cache,如果还没有找到，就要从头开始进行分页机制的地址转换了，具体的转换过程上面已经讲到过。

5 Multiple Cached Entries for a Single Paging-Structure Entry
按照题目翻译，这部分的意思就是可能存在这么一种情况：
对于某一级的一个页结构的入口地址，可能有多个缓存入口的情况，下面我们来考虑一下，在什么情况下会出现这种情况。
我们很容易想到：不同的线性地址映射到同一物理地址这种情况。
这种情况下到底有什么优缺点我还怎么看明白，以后补充！

6 TLBs 和各级页结构cache的无效
这部分就是讲无何保证TLBs和各级页结构cache的内容是最新的，即是修改过的。
下面讲了使cache无效的方法：
（1）INVLPG指令：对某一个线性地址进行单独的操作，这条指令将会使线性地址指向的页号任何的TLBs入口无效，包括那些被设置了G位的入口，另外，还会无效所有的页结构cache而不管是否是不是与所指的线性地址相对应。
（2）Mov to CR3:无效所有的TLBs，除了那些G＝1的TLBs入口。同时无效所有的页结构cache
（3）mov to CR4:如果这条指令修改了CR4的PGE位，将会无效所有的TLBs入口，包括那些G＝1的入口，同时，无效所有的页结构cache
除了上面提到的无效的情况，page fault也会使TLBs和各级cache中相同的线性地址的的入口无效。

这本intel手册后面还讲到了一些优化的使无效方法，带有扩展的32位的页模式，以及多处理器上页结构变化的传播。总体来说对我们用户级的程序设计没有什么太大关系，个人感觉仅仅是讲了一种原理，而且，我是本着了解L2cache的替换策略来阅读这本手册的，读完后，感觉对我的目的没有什么太大的帮助，就当是增加一点intel体系结构的常识吧！
最后，希望有兴趣的朋友能和我多家讨论关于cache的相关知识。

阅读(1829) | 评论(0) | 转发(0) |

上一篇：Understanding Caching(深入理解cache)

下一篇：skb相关笔记

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6