Chinaunix首页 | 论坛 | 博客
  • 博客访问: 833644
  • 博文数量: 125
  • 博客积分: 4066
  • 博客等级: 上校
  • 技术积分: 1401
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-03 18:58
文章分类

全部博文(125)

文章存档

2014年(1)

2013年(1)

2012年(2)

2011年(29)

2010年(92)

我的朋友

分类: LINUX

2010-05-06 15:41:54

第一章:数据类型与运算符篇
一,对于数据类型,其性质主要有两个,一个是比特数(数据类型所占字节数),一个是数据在内存中的存放方式,只要理解了这两点,对于数据类型就算掌握了.
    第一点需要特别注意,在不同的平台上,数据类型的比特数是不同的.特别是对于做嵌入式的,这一点需牢牢记在心中.数据的基本类型主要有一下几种:bool(布尔型),char,short,int,long,float,double;
  char   占1byte;
  short  占2个bytes;
  int    在有些系统中与short一样,而在另一些系统中则与long一样占4bytes;
  long   一般占4bytes,在某些特定的系统中占8bytes;
  float  占4bytes;
  double 占8bytes;
  对于int型,C语言中只规定short(int)应不长于int型,long(int)不短与int型;具体如何实现则由系统自行规定.我们可由以下程序来检测.
#include
#define PRINTF(a)  printf("%s is %d bytes\n",#a,sizeof(a))
int main()

 PRINTF(char);
 PRINTF(short);
 PRINTF(int);
 PRINTF(long);
 PRINTF(float);
 PRINTF(double);
 PRINTF(long double);

 getchar();
 return 0;
}
 
二,在确认了数据的比特数后,我们将讨论数据的存放形式:
 1.在计算机中数据是以补码的形式存放的.为什么会采用这种方式呢?
   正数的补码为其原码,负数的补码为其反码加一.这样处理其实是为了方便计算机计算.我们知道,如果用8位来表示一个数,只能表示2^8=256个数,即0x00~0xff.
   表示成无符号数,我们可以用来表示0-255;从0000 0000-1111 1111.
   表示成有符号,我们只能表示-128~127;因为第7位用来表示符号位了,1表示是负数数,0表示是正数.正数0000 0000~0111 1111(0~127);负数为1000 0000-1111 1111(-128~-1).这样我们可以看出,127+1在计算机里应该是1000 0000,如果表示无符号数,我们当然可以理解成128.但是当我们表示有符号数时,已经溢出了,又从最小的数开始,那就是-128了,这样我们的理解和 计算机的理解是一样的.
   以-1来举例,0的前一个数二进制为1111 1111,而1为0后一个数0000 0001,我们可以看出,-1二进制码其实就是1的的二进制码的反码(1111 1110)再加一.
  计算机做加法时,1+1为(0000 0001)+(0000 0001)=(0000 0010)
  计算机做减法时,1-1=1+(-1)为(0000 0001)+(1111 1111)=(0000 0000)
  计算机把减法也当成加法来做,这要就简便多了.
 2.大端模式和小端模式:
  在内存中,我们假设连续四个byte中存放着
  数据               地址
  0000 0001          0000 0000(0x00)
  0000 0010          0000 0001(0x01)
  0000 0100          0000 0010(0x02)
  0000 1000          0000 0011(x003)
  那么我们这个数是多少呢?是按从小到大地址排还是从大到小地址排?
  从小大大: 0000 0001|0000 0010|0000 0100|0000 1000|   =   16909320     
  从大到小: 0000 1000|0000 0100|0000 0010|0000 0001|   =   134480385

我们管按从小到小地址排列的叫大端模式,即高地址放低位,低地址放高位
我们管按从大到小地址排列的叫小端模式,即高地址放高位,低地址放低位

一般我们采用小端模式,以符合人脑思维习惯.具体采用哪种模式,是由cpu引脚接法来控制的.

感觉这个说的不是很清除,下面单独贴出一个转载的。

3.实数的表示范围:
实数在计算机中表示方式是用指数的方法来表示的,在内存中一部分位用来表示小数部分,一部分来来表示

指数部分.
比如float,高24位用来表示小数部分,后8位用来表示指数部分,其有效数字位数为6~7(2^23=8388608(7位

有效数字)).实型也分有符号和无符号数.
double则为64位,如果用48位表示小数部分,12位表示指数,其有效数字大概在15~16位.
C语言并未规定实数该怎么存(小数部分多少位,指数部分多少位),所以其表示的范围在各个编译系统下也有所不同.我们只需记住大概的范围就可以了.

大端(Big Endian)与小端(Little Endian)详解

【大端(Big Endian)与小端(Little Endian)简介】
Byte Endian是指字节在内存中的组织,所以也称它为Byte Ordering,或Byte Order。
     对于数据中跨越多个字节的对象, 我们必须为它建立这样的约定:
(1) 它的地址是多少?
(2) 它的字节在内存中是如何组织的?
    针对第一个问题,有这样的解释:
    对于跨越多个字节的对象,一般它所占的字节都是连续的,它的地址等于它所占字节最低地址。(链表可能是个例外, 但链表的地址可看作链表头的地址)。
    比如: int x, 它的地址为0x100。 那么它占据了内存中的Ox100, 0x101, 0x102, 0x103这四个字节(32位系统,所以int占用4个字节)。
    上面只是内存字节组织的一种情况: 多字节对象在内存中的组织有一般有两种约定。 考虑一个W位的整数。
    它的各位表达如下:[Xw-1, Xw-2, ... , X1, X0],它的
    MSB (Most Significant Byte, 最高有效字节)为 [Xw-1, Xw-2, ... Xw-8];
    LSB (Least Significant Byte, 最低有效字节)为 [X7,X6,..., X0]。
    其余的字节位于MSB, LSB之间。

LSB和MSB谁位于内存的最低地址, 即谁代表该对象的地址?
这就引出了大端(Big Endian)与小端(Little Endian)的问题。
如果LSB在MSB前面, 既LSB是低地址, 则该机器是小端; 反之则是大端。
DEC (Digital Equipment Corporation,现在是Compaq公司的一部分)和Intel的机器(X86平台)一般采用小端。
IBM, Motorola(Power PC), Sun的机器一般采用大端。
当然,这不代表所有情况。有的CPU即能工作于小端, 又能工作于大端, 比如ARM, Alpha,摩托罗拉的PowerPC。 具体情形参考处理器手册。

具体这类CPU是大端还是小端,应该和具体设置有关。
(如,Power PC支持little-endian字节序,但在默认配置时是big-endian字节序)
一般来说,大部分用户的操作系统(如windows, FreeBsd,Linux)是Little Endian的。少部分,如MAC OS ,是Big Endian 的。
所以说,Little Endian还是Big Endian与操作系统和芯片类型都有关系。

Linux系统中,你可以在/usr/include/中(包括子目录)查找字符串BYTE_ORDER(或
_BYTE_ORDER, __BYTE_ORDER),确定其值。BYTE_ORDER中文称为字节序。这个值一般在endian.h或machine/endian.h文件中可以找到,有时在feature.h中,不同的操作系统可能有所不同。

对于一个数0x1122
使用Little Endian方式时,低字节存储0x22,高字节存储0x11
而使用Big Endian方式时, 低字节存储0x11, 高字节存储0x22

经一网友指正,才知道,上面的描述,是不准确的.

想了下,觉得如下描述可能更合适:

使用Little Endian方式存储数据时,数据的LSB相对最没意义的数据位,存放在低地址位置,这里的LSB也就是22了.也即,

低地址存储0x22, 高地址存储0x11

而使用Big Endian方式存储数据时,数据的MSB最有意义的数据位,存放在低地址位置,这里的MSB也就是11了.也即

低地址存储0x11, 高地址存储0x22

助记:

1)所谓MSB (Most Significant Byte),名字很复杂,不知是否有人没搞懂,反正我开始看到这个词时候,就很糊涂,有点不完全理解.其实简单说MSB就是,一个数字中,最重要的那位,

举例来说,12004,中文读作,一万两千零四,那最高位的1,就表示了一万,此处就称作MSB,最有意义的位.

2)一般常见的数据存储,用文字写出来的时候,其内容书写格式,多数是从低地址到高地址.

举例,一个16进制数是 0x11 22 33, 而存放的位置是

地址0x3000 中存放11

地址0x3001 中存放22

地址0x3002 中存放33

连起来就写成地址0x3000-0x3002中存放了数据0x112233.

而这种存放和表示方式,正好符合大端.

解释的有点乱,希望有人能看懂.

如果还有哪里有误,还请各位继续指正.谢谢.

【用函数判断系统是Big Endian还是Little Endian】
bool IsBig_Endian()
//如果字节序为big-endian,返回true;
//反之为   little-endian,返回false
{
    unsigned short test = 0x1122;
    if(*( (unsigned char*) &test ) == 0x11)
       return TRUE;
else
    return FALSE;

}//IsBig_Endian()


以上内容,整理自:

如何判断系统是Big Endian还是Little Endian?
http://jlingmei.spaces.live.com/blog/cns!77254CCC13222C11!391.entry?wa=wsignin1.0

判断机器字节存储顺序是big endian还是little endian
http://hi.baidu.com/cppyun/blog/item/9625c8396d5ff7f33b87ce33.html



阅读(1085) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~