分类: 嵌入式
2010-05-16 21:13:34
由成都无线龙通讯公司编写、北京航空航天大学出版社出版的无线单片机技术丛书之八<
将高性能、低功耗的ARM微控制器与目前新兴的ISM波段短距离无线通信技术和各种新兴的无线网络技术相结合,将是未来嵌入式设计的一个“热点”。本书以 ARM9微控制器为基础,分别介绍ARM9的基础实战、ARM9与ZigBee无线网络实战、ARM9与蓝牙无线网络实战、ARM9与GSM/GPRS网络实战,为读者展示一个嵌入式无线设计开发的思路。
本书配套系统介绍请点击如下查阅:32位ZigBee无线开发平台。
前言
一、嵌入式无线需要32位微控制器
集成电路,特别是SoC(片上系统)技术的发展,使需要低功耗、低成本的嵌入式应用市场发生了天翻地覆的变化。以ARM微控制器为代表的一批新型、高性能、低功耗、低价格微处理器的诞生和快速成长,使嵌入式产品的开发和应用开始广泛地进入到了32位的新时代。
采用ARM 32位结构的微控制器同目前市场上的8位微控制器比较,在价格上的差异越来越小,但是在性能上却有很大的提高。这些32位的微控制器在单芯片中,除了集成有大量的输出、输入接口、串口、以太网接口、A/D转换器等外,还集成了256 KB~2 MB闪存、20 KB~100 KB静态存储器(SRAM),从而构成了一个高速、高性能的32位片上系统。这将为嵌入式系统的设计和应用提供更多的灵活性和更多的选择性,进而大大推动嵌入式设计应用向更深的层次发展。
出版者注:为了不增加读者的经济负坦和免除读者录入程序之劳,凡是程序清单的序号带有“*”号的,如读者需要参考,可登录作者单位——成都无线龙通讯科技有限公司的网站()下载。
在以ARM为核心的32位微控制器快速成长的同时,无线通信和无线网络技术近年来也有了迅速的发展。蓝牙无线网络技术经过多年的努力,特别是在无线语音、 PC外设等方面有了很大发展;WiFi(IEEE 802.11高速无线网络标准)/GSM网络/ZigBee(IEEE 802.15.4无线网络标准)同样开始取得长足的进展并得到广泛的应用。
由于以ARM为核心的32位微控制器将其大量的资源集成在芯片内部,包括I/O、存储器、通信接口等,使系统电路板需要的空间大大简化,而且一些对高频通信可能产生的干扰的噪声大大减少,加上可以用电池供电和具有低功耗模式等新的特点,因此越来越多的无线网络和其他短距离无线通信系统开始采用以ARM为核心的32位微控制器来进行设计。
将高性能、低功耗的ARM微控制器同目前新兴的ISM波段短距离无线通信技术和各种新兴的无线网络技术相结合,将是未来嵌入式设计的一个“热点”,也是一个“难点”。对广大电子工程师和单片机工程师而言,这将是一个具有很大挑战性,探索性的工作。
二、32位嵌入式设计“热点”——无线通信和无线网络
无线通信和无线网络技术近年来获得了迅猛的进展,各种新的无线标准如雨后春笋般涌现,通信可靠性越来越高,而功耗越来越低。
无线通信和无线网络的发展,对无线通信和无线网络系统使用的微控制器提出了全新的要求。主要有以下几点:
1. 更快的处理速度
无线网络的速度越来越快,不仅要在瞬间处理大量的数据包装,还要处理图像、进行语音压缩等。这些都要求具有更快速的实时处理能力。同时,还要可以更容易地得到实时操作系统(RTOS)、图形处理软件技术的支持。
2. 更强的网络拓扑路由处理
像ZigBee无线网络系统,需要能处理更多无线节点和进行更快、更复杂的网状网络路由计算,而且要求实时完成,而采用8位微处理器的无线网络系统在节点处理数量、路由计算速度方面都远远不能满足要求。
3. 更加安全算法
无线通信的网络安全算法,也需要大量的实时计算能力,来实现各种复杂的网络加密计算。
4. 需要更大的程序存储器空间和数据存储器空间,以及更多的通信接口
采用以ARM为核心的32位微控制器,作为无线网络的基带处理器,可以满足大多数高速无线通信和无线网络系统的基本要求。
对于无线网络路由器、无线网关、无线抄表集中器、工业控制设备、WiFi热点、大型高速网络覆盖接入器设计等,以ARM为核心的32位微控制器可以提供更大的网络节点容量、更快的路由算法、更复杂的加密算法等,从而使系统更加可靠和高效。
对于无线数字家庭显示单元、无线控制设备、高级无线手持终端、无线测试设备、无线网络监控仪器、汽车电子等无线产品开发,采用以ARM为核心的32位微控制器可以驱动高分辨率的图形显示功能,使无线通信和无线网络产品具有更好的直观性和更良好的监视界面。再加上实时操作系统(RTOS)和图形界面(GUI)的支持,可以大大缩短无线应用产品的开发时间,更快上市,争取商机。
三、嵌入式无线设计的“难点”——“三大难关”
1. ARM技术是第1关
对于很多电子工程师和单片机工程师而言,最新的以ARM为核心的32位微控制器是挡在面前的第1座大山。ARM微控制器的芯片虽然小,但是结构非常复杂,仅是英文原厂数据手册就有几百页;从汇编语言到C语言,加上RTOS、GUI编程,哪一样都不简单;各种新名词、新技术,很容易让他们眼花缭乱,学习困难。
2. 无线技术和无线网络技术是第2关
高频系统工作在300 MHz~2.4 GHz的高频频段,对线路设计、元件选择有较高要求。
微处理器和其他数字电路对高频电路的相互干扰。
无线通信在空气中容易被干扰,因而需要进行一系列软件处理,包括纠错、防止碰撞、通信协议处理等,而熟悉这些技术,需要大量时间和经验。
无线网络协议栈和各种无线网络的标准,需要用较长时间来熟悉和理解。
3. 缺乏可视化直观性无线测试设备是第3关
无线通信和无线网络的设计开发,高频设计需要工作在数吉赫兹(GHz)的无线测试设备,价格昂贵,动辄几千、数万美元,很少有单位能配备。而没有这样的高频设备,很难直观地观察无线通信和无线网络系统的工作状态。
剖析几种主流嵌入式软件代码压缩技术
并不是所有的处理器都拥有或需要代码压缩,只有32位的RISC(精简指令集计算机)处理器需要代码压缩,因为RISC处理器代码密度较差。RISC处理器在过去是设计用于通用计算机和工作站,在其设计时认为存储器价格便宜。尽管存储器价格可能便宜,但如果能占用更少的存储器不是更便宜吗?对于蜂窝电话以及其他成本控制严格的嵌入式系统应用而言,在RAM或ROM上5美元的成本差异,就能导致量产时利润的巨大差别。通常,存储器的大小是固定的,而产品的功能特性却各异。紧凑的目标代码意味着可以实现更多的自动拨号、更好的语音识别能力,或者可能是更清晰的屏幕显示。
在32位嵌入式处理器中,ARM、MIPS以及PowerPC曾是首先寻找出降低其存储器消耗、提高代码密度方法的几种处理器。更早一些的处理器,如摩托罗拉的68k系列以及英特尔的x86系列,并不需要代码压缩。事实上,其标准代码密度都比RISC处理器的代码压缩模式还要高。
易于使用的Thumb技术
我们先从ARM的代码压缩方案(Thumb)讲起,因为其使用广泛、有很好的支持,是一个典型处理器代码压缩方案,并相当简洁、有效。
Thumb实际上是添加到ARM的标准RISC指令集之上的独立指令集。在你的代码中,你可以通过一条模式切换指令在这两种指令集之间进行切换。Thumb指令集架构(Instruction Set Architecture, ISA)是由大约36条16位指令组成,仅靠这些指令是完成不了太多任务的,但Thumb指令集包括了基本的加法、减法、循环移位以及跳转指令。通过使用这些较短的指令替换ARM标准的32位指令,可以将某些代码的规模减小大约20%到30%。但有一些问题需要引起注意:
首先,Thumb代码和标准ARM代码不能混杂使用,必须显式地在两种模式间进行切换,就好像Thumb是一套完全不同的指令集(实际上也是)。这迫使程序员将所有的16位代码与32位代码分开并隔离到独立的模块中。
其次,由于Thumb是经过简化和精简的指令集架构,在Thumb模式中无法完成所有你希望的工作。Thumb模式无法进行诸如处理中断、长跳转、原子存储器(atomic memory)操作,或协处理器操作等。Thumb有限的指令意味着仅对基本的算术和逻辑操作有用,其他的任何工作必须使用ARM的标准32位指令集来完成。
Thumb的限制不仅表现在指令集上,当处于Thumb模式中,ARM处理器将仅有8个寄存器(而不是16个),这些寄存器无法像标准模式下ARM代码那样进行条件执行和移位或循环移位操作。在标准ARM代码和Thumb代码间进行参数传递并不困难,只要将参数放到堆栈中或通过处理器的前8个寄存器就可以了。
从标准模式到Thumb模式之间的来回切换也要消耗时间,而且还要增加代码。此外,还需要几十个前导(preamble)以及后同步指令(postamble)来组织指针并清空CPU的流水线。如果在Thumb模式中运行的代码小于几十条指令,就不值得为之付出这样的开销。
最后,Thumb还对于性能有着少许的影响。通常,使用Thumb指令对代码进行压缩会导致代码运行速度降低大约15%,这主要是由于在16位模式和32位模式间切换所引起的。Thumb指令还不如32位的标准指令灵活,因此,和32位代码相比,常常需要更多的指令来完成同样的工作。从积极的一方面来说,由于其指令长度只有32位指令集的一半,Thumb使得缓存的使用效率更高。
如果任务能够在这些限制下完成,Thumb可以节约不少成本。Thumb技术已经得到每一款ARM处理器的支持,无论用户使用与否,多数ARM编译器以及汇编程序都支持Thumb指令集。因此,采用Thumb的体验应该相当轻松。
MIPS处理器
理解了Thumb技术后,MIPS16e就没什么新奇的了。一些MIPS处理器中增加了另外的16位指令集,与ARM系统非常类似。MIPS16e指令集包括了一组16位的标准MIPS算法、逻辑以及跳转指令的简化版本。其使用和Thumb一样,也需要在标准模式和MIPS16e模式之间来回切换,这也将导致付出时间和增加代码的开销。除非能在“压缩”模式上运行相当长时间,否则没有必要进行模式切换。其代码压缩效率和ARM差不多,对于多数程序而言,也是20%到30%。
MIPS16e和Thumb都不能对代码进行真正的压缩,它们只是对部分指令提供了可替换的操作码,而且得到的压缩比是依赖于短操作码和长操作码的总长度的比值。也就是说,依赖于代码所完成的任务,诸如操作系统和中断处理例程等系统级代码根本就不能使用16位指令,因此不能获得代码压缩效果。一般的算法,只要不使用任何大操作数,就能得到很好的压缩效率。最后,别忘了数据是无法进行压缩的,只有代码能够被压缩。如果你应用代码中包括了大量的静态数据结构,所能得到的总存储器节约是非常小的。还有,15%的性能损失也许很不值得。另一方面,MIPS16e和Thumb都是免费的(假定你的处理器已经包含了它们),选用它们的成本非常低。
PowerPC的CodePack技术
值得提前说明的是,IBM的CodePack方法是各种代码压缩技术中最复杂的。与Thumb和MIPS16e不同,CodePack系统是真正对运行代码进行压缩,就好像在PowerPC软件中运行WinZip。CodePack会分析并压缩整个程序,生成的用户代码必须在运行中解压缩并执行压缩版本。尽管很复杂,CodePack和其它技术一样提供20%到30%的空间节省。
CodePack是一项很有吸引力的技术。在使用该技术时,只须和平常一样使用标准工具编译嵌入式PowerPC代码就行,CodePack甚至对已有的代码也能使用(无论有没有源代码)。在将代码写入ROM或装入磁盘之前,运行CodePack压缩工具对代码进行压缩。压缩工具会分析代码指令的分布并生成一对专门针对这个程序代码的键值。当运行压缩后的代码时,拥有CodePack功能的处理器使用这一对键值来在运行中解开压缩的代码,就好像直接运行压缩后的代码。解压缩会对处理器的流水线产生很小的延迟,但是其影响被取指延迟以及其它延迟所掩盖。对于绝大多数应用,CodePack带来的性能影响是可以忽略的。
但是,CodePack还有一些其它的影响。由于每一个压缩的程序都有其单独的压缩键值,CodePack本质上既是压缩系统也是加密系统。没有键值,无论你自己还是其它任何人都无法运行相应的程序。如果丢失了或者未获得相应的键值,压缩后的程序只是一堆无用的乱码,这也意味着压缩后的PowerPC程序不是二进制代码兼容的。除非同时包括其解压缩键值,否则无法轻易地和其它系统交换压缩后的程序。这会使嵌入式系统软件的现场分配稍微有些复杂。
另外,CodePack为每个程序生成两个键值是因为指令的高16位和低16位是分别进行压缩的。IBM的工程师发现每一条PowerPC指令的高半字(操作码就在其中)和低半字(其内容通常为操作数、偏移量或掩码)的分布频度是不一样的。对它们分别使用不同的压缩算法会使压缩效果比仅使用任何单一算法要好,这就是CodePack对程序所做的事。
ARCompact
ARC International公司又采用了另外的代码压缩方法。因为ARCtangent处理器有用户可定义的指令集,ARC(及其用户)可以对指令集进行随心所欲的修改。作为ARCompact,ARC公司决定加入一组16位指令来改进其处理器的代码密度。
而ARCompact与Thumb以及MIPS16e的区别在于可以将16位代码和32位代码任意混杂。由于没有模式切换,代码中任意分布的少许16位指令无须为之付出什么开销。在任何可能的情况下,ARC的编译器的默认配置会产生16位操作(为了强制编译器生成32位代码或与旧的处理器保持兼容,你可以关掉这个功能)。
ARC可以混合不同长度代码而不必付出相应的开销,是因为其指令架构要比ARM和MIPS新。那些RISC架构的指令集(包括PowerPC)在指令字中没有指明指令长度的位。诸如ARC或Tensilica的新伪RISC架构,以及像x86和68k旧的架构拥有这些位。无论是出于无意还是远见,变长度指令架构因为更紧凑的代码而具优势。
Thumb的改进版--Thumb-2
就在最近,ARM对其代码压缩系统进行了改造并发布了Thumb-2。Thumb-2并不是Thumb的升级,相反,它是另起炉灶,并且可以完全代替Thumb和原先的ARM指令集。Thumb-2有些类似ARCompact或摩托罗拉的68k,可以无需模式切换就运行16位与32位混合代码。总的来说,Thumb-2提供的代码压缩效率要略差,但其性能损失也较小。
为了做到这一点,ARM需要在其操作码映射中找到一个突破口(hole),他们在BL指令(条转并连接指令,是Thumb和ARM模式之间切换的指令)中找到了需要的突破口。在原有的指令集中,BL指令有一些位没有使用,这些原先未定义的位给全新的指令集提供了切换入口。其编码确实不怎么样,但确实很有效。
Thumb-2最大的优势在于它是一套完整的指令集,程序无需切换回“标准”32位ARM模式,原先Thumb模式的限制再也没有了。程序现在可以处理中断、设置MMU、管理缓存,和真正的微处理器并没什么不同。
Thumb-2还是需要损失一定的性能。尽管没有了模式切换开销,与标准ARM代码相比,它还是要花费多一些的Thumb-2指令来完成特定的任务。对于ARM处理器而言,这些额外的指令(以及额外的周期)会使速度降低大约15%到20%。
未来的ARM处理器最终将只运行Thumb-2代码。由于它用一套单一的更多压缩指令的指令集有效地取代了ARM和Thumb指令集,为什么不会最终彻底取代它们呢?但问题是ARM的软件兼容性怎么办?直到现在,所有的ARM处理器(除了Intel的XScale)都是二进制兼容。尽管支持Thumb-2的新型处理器将能运行现有的ARM和Thumb代码,但反之则不行。当Thumb-2广泛推广后,它将创建一套单独但等价的软件库。