数据类型-zhaixishan-ChinaUnix博客

老翟的仓库zhaixishan.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zhaixishan

博客访问： 841227
博文数量： 125
博客积分： 4066
博客等级：上校
技术积分： 1401
用户组：普通用户
注册时间： 2010-03-03 18:58

文章分类

全部博文（125）

HEVC（1）
RenderScript研究（0）
StageFright（7）
音视频相关（11）
OpenCores（17）
Android（12）
Alsa（14）
PulseAudio（3）
网络应用（0）
系统API（6）
操作系统（1）
常用工具使用指南（10）
工具安装（6）
嵌入式移植（1）
基本功（19）
生活感悟（15）
未分配的博文（2）

文章存档

2014年（1）

2013年（1）

2012年（2）

2011年（29）

2010年（92）

我的朋友

相关博文

数据类型

分类： LINUX

2010-05-06 15:41:54

第一章:数据类型与运算符篇
一,对于数据类型,其性质主要有两个,一个是比特数(数据类型所占字节数),一个是数据在内存中的存放方式,只要理解了这两点,对于数据类型就算掌握了.
    第一点需要特别注意,在不同的平台上,数据类型的比特数是不同的.特别是对于做嵌入式的,这一点需牢牢记在心中.数据的基本类型主要有一下几种:bool(布尔型),char,short,int,long,float,double;
char   占1byte;
short 占2个bytes;
int   在有些系统中与short一样,而在另一些系统中则与long一样占4bytes;
long 一般占4bytes,在某些特定的系统中占8bytes;
float 占4bytes;
double 占8bytes;
对于int型,C语言中只规定short(int)应不长于int型,long(int)不短与int型;具体如何实现则由系统自行规定.我们可由以下程序来检测.
#include
#define PRINTF(a) printf("%s is %d bytes\n",#a,sizeof(a))
int main()
{
PRINTF(char);
PRINTF(short);
PRINTF(int);
PRINTF(long);
PRINTF(float);
PRINTF(double);
PRINTF(long double);

getchar();
return 0;
}

二,在确认了数据的比特数后,我们将讨论数据的存放形式:
1.在计算机中数据是以补码的形式存放的.为什么会采用这种方式呢?
   正数的补码为其原码,负数的补码为其反码加一.这样处理其实是为了方便计算机计算.我们知道,如果用8位来表示一个数,只能表示2^8=256个数,即0x00~0xff.
   表示成无符号数,我们可以用来表示0-255;从0000 0000-1111 1111.
   表示成有符号,我们只能表示-128~127;因为第7位用来表示符号位了,1表示是负数数,0表示是正数.正数0000 0000~0111 1111(0~127);负数为1000 0000-1111 1111(-128~-1).这样我们可以看出,127+1在计算机里应该是1000 0000,如果表示无符号数,我们当然可以理解成128.但是当我们表示有符号数时,已经溢出了,又从最小的数开始,那就是-128了,这样我们的理解和计算机的理解是一样的.
   以-1来举例,0的前一个数二进制为1111 1111,而1为0后一个数0000 0001,我们可以看出,-1二进制码其实就是1的的二进制码的反码(1111 1110)再加一.
计算机做加法时,1+1为(0000 0001)+(0000 0001)=(0000 0010)
计算机做减法时,1-1=1+(-1)为(0000 0001)+(1111 1111)=(0000 0000)
计算机把减法也当成加法来做,这要就简便多了.
2.大端模式和小端模式:
在内存中,我们假设连续四个byte中存放着
数据               地址
0000 0001          0000 0000(0x00)
0000 0010          0000 0001(0x01)
0000 0100          0000 0010(0x02)
0000 1000          0000 0011(x003)
那么我们这个数是多少呢?是按从小到大地址排还是从大到小地址排?
从小大大: 0000 0001|0000 0010|0000 0100|0000 1000|   =   16909320
从大到小: 0000 1000|0000 0100|0000 0010|0000 0001|   =   134480385

我们管按从小到小地址排列的叫大端模式,即高地址放低位,低地址放高位
我们管按从大到小地址排列的叫小端模式,即高地址放高位,低地址放低位

一般我们采用小端模式,以符合人脑思维习惯.具体采用哪种模式,是由cpu引脚接法来控制的.

感觉这个说的不是很清除，下面单独贴出一个转载的。

3.实数的表示范围:
实数在计算机中表示方式是用指数的方法来表示的,在内存中一部分位用来表示小数部分,一部分来来表示

指数部分.
比如float,高24位用来表示小数部分,后8位用来表示指数部分,其有效数字位数为6~7(2^23=8388608(7位

有效数字)).实型也分有符号和无符号数.
double则为64位,如果用48位表示小数部分,12位表示指数,其有效数字大概在15~16位.
C语言并未规定实数该怎么存(小数部分多少位,指数部分多少位),所以其表示的范围在各个编译系统下也有所不同.我们只需记住大概的范围就可以了.

大端(Big Endian)与小端(Little Endian)详解

【大端(Big Endian)与小端(Little Endian)简介】
Byte Endian是指字节在内存中的组织，所以也称它为Byte Ordering，或Byte Order。
     对于数据中跨越多个字节的对象，我们必须为它建立这样的约定:
(1) 它的地址是多少?
(2) 它的字节在内存中是如何组织的?
    针对第一个问题，有这样的解释:
    对于跨越多个字节的对象，一般它所占的字节都是连续的，它的地址等于它所占字节最低地址。(链表可能是个例外，但链表的地址可看作链表头的地址)。
    比如: int x，它的地址为0x100。那么它占据了内存中的Ox100， 0x101， 0x102， 0x103这四个字节（32位系统，所以int占用4个字节）。
    上面只是内存字节组织的一种情况: 多字节对象在内存中的组织有一般有两种约定。考虑一个W位的整数。
    它的各位表达如下:[Xw-1， Xw-2， ... ， X1， X0],它的
    MSB (Most Significant Byte，最高有效字节)为 [Xw-1， Xw-2， ... Xw-8];
    LSB (Least Significant Byte，最低有效字节)为 [X7，X6，...， X0]。
    其余的字节位于MSB， LSB之间。

LSB和MSB谁位于内存的最低地址，即谁代表该对象的地址?
这就引出了大端(Big Endian)与小端(Little Endian)的问题。
如果LSB在MSB前面，既LSB是低地址，则该机器是小端; 反之则是大端。
DEC (Digital Equipment Corporation，现在是Compaq公司的一部分)和Intel的机器（X86平台）一般采用小端。
IBM， Motorola(Power PC)， Sun的机器一般采用大端。
当然，这不代表所有情况。有的CPU即能工作于小端，又能工作于大端，比如ARM， Alpha，摩托罗拉的PowerPC。具体情形参考处理器手册。
具体这类CPU是大端还是小端，应该和具体设置有关。
（如，Power PC支持little-endian字节序，但在默认配置时是big-endian字节序）
一般来说，大部分用户的操作系统（如windows, FreeBsd,Linux）是Little Endian的。少部分，如MAC OS ,是Big Endian 的。
所以说，Little Endian还是Big Endian与操作系统和芯片类型都有关系。

Linux系统中，你可以在/usr/include/中（包括子目录）查找字符串BYTE_ORDER(或
_BYTE_ORDER, __BYTE_ORDER)，确定其值。BYTE_ORDER中文称为字节序。这个值一般在endian.h或machine/endian.h文件中可以找到,有时在feature.h中，不同的操作系统可能有所不同。

对于一个数0x1122
使用Little Endian方式时，低字节存储0x22，高字节存储0x11
而使用Big Endian方式时, 低字节存储0x11, 高字节存储0x22

经一网友指正,才知道,上面的描述,是不准确的.

想了下,觉得如下描述可能更合适:

使用Little Endian方式存储数据时,数据的LSB相对最没意义的数据位,存放在低地址位置,这里的LSB也就是22了.也即,

低地址存储0x22, 高地址存储0x11

而使用Big Endian方式存储数据时,数据的MSB最有意义的数据位,存放在低地址位置,这里的MSB也就是11了.也即

低地址存储0x11, 高地址存储0x22

助记:

1)所谓MSB (Most Significant Byte),名字很复杂,不知是否有人没搞懂,反正我开始看到这个词时候,就很糊涂,有点不完全理解.其实简单说MSB就是,一个数字中,最重要的那位,

举例来说,12004,中文读作,一万两千零四,那最高位的1,就表示了一万,此处就称作MSB,最有意义的位.

2)一般常见的数据存储,用文字写出来的时候,其内容书写格式,多数是从低地址到高地址.

举例,一个16进制数是 0x11 22 33, 而存放的位置是

地址0x3000 中存放11

地址0x3001 中存放22

地址0x3002 中存放33

连起来就写成地址0x3000-0x3002中存放了数据0x112233.

而这种存放和表示方式,正好符合大端.

解释的有点乱,希望有人能看懂.

如果还有哪里有误,还请各位继续指正.谢谢.

【用函数判断系统是Big Endian还是Little Endian】
bool IsBig_Endian()
//如果字节序为big-endian，返回true;
//反之为   little-endian，返回false
{
    unsigned short test = 0x1122;
    if(*( (unsigned char*) &test ) == 0x11)
       return TRUE;
else
    return FALSE;

}//IsBig_Endian()

以上内容，整理自：

如何判断系统是Big Endian还是Little Endian？
http://jlingmei.spaces.live.com/blog/cns!77254CCC13222C11!391.entry?wa=wsignin1.0

判断机器字节存储顺序是big endian还是little endian
http://hi.baidu.com/cppyun/blog/item/9625c8396d5ff7f33b87ce33.html

阅读(1114) | 评论(0) | 转发(0) |

上一篇：关于xmms安装指南

下一篇：wave格式音频文件采样率转换

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6