Chinaunix首页 | 论坛 | 博客
  • 博客访问: 216350
  • 博文数量: 59
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 424
  • 用 户 组: 普通用户
  • 注册时间: 2012-04-25 12:57
文章分类

全部博文(59)

文章存档

2016年(23)

2015年(30)

2014年(6)

我的朋友

分类: 嵌入式

2016-10-09 15:28:00

  • ARM你必须知道的事儿——为啥“PC = PC + 8”?

  • 2015-05-11 16:55 发表   系统分类:   自定义分类:
    标签:

为啥是“PC = PC + 8”;

“PC = PC + 8”其实这样写容易让人蒙了。“PC = PC + 8”真正含义应该是:

执行处代码地址 = PC - 8;

也就是说,”PC指向的地址“领先“执行处代码地址”8个字节;

也就是说“PC = PC + 8”中的第二个PC,其实表示是“执行处代码地址”

然后,理解为啥是8?

首先,arm的地址宽度是4个字节,所以每执行一条指令,PC就会自加4.

而一条指令要完全被arm吸收,需要多个步骤,拿arm7举例它采用了3级流水线技术。

wps13E1.tmp

流水线,对于我们这种玩FPGA的再熟悉不过了,以3级流水线来说,就是把一件事情分成3个步骤,每个步骤同时处理,

前两个周期为潜伏期,无法出结果,之后结果会源源不断的输出。

 

想象一下,一条条指令,就像一个个等待加工的产品,奔跑在传送带上,而“FETCH”,“DECODE”,“EXECUTE”,就是3道加工工序。

wps1401.tmp

1、在第一个周期,PC指向第一条程序指令,进行取值(FETCH),DECODE,和EXECUTE步骤“扑空”

2、在第二个周期,接着PC + 4,PC指向第二条程序指令进行取值(FETCH),DECODE处理了在一个周期,FETCH到的指令,EXECUTE再次扑空。

3、在第三个周期,依然PC + 4,PC指向第三条程序指令进行取值(FETCH),DECODE处理了在二个周期,FETCH到的指令,

EXECUTE这时,处理在一个周期FETCH到的指令,这个指令同时也就是在第二个周期DECODE的指令。

4、之后每个时钟周期,EXECUTE都能处理到经过两次加工的code,不过PC始终领先于它,也就是:执行处代码地址 = PC - 8;

 

     而ARM9通过增加流水线级数,简化了流水线的各级逻辑,进一步提高了处理器的性能。采用5级流水线技术,但是同样是“PC = PC + 8”,

这是为什么呢?我们来看看图:

wps1402.tmp

我们发现EXECUTE仍然在第三个步骤,及符合:执行处代码地址 = PC - 8;只要理解这一点阅读代码也就够了。

阅读(2083) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~