字节顺序:大端字节(big-endian)和小端字节(little-endian)-linux

06Linuxwuliqiang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

linux_wuliqiang

博客访问： 5604469
博文数量： 763
博客积分： 12108
博客等级：上将
技术积分： 15717
用户组：普通用户
注册时间： 2007-09-28 21:21

个人简介

业精于勤，荒于嬉

文章分类

全部博文（763）

Home（28）

生活小常识（7）
Linux（99）

git（3）

Socket（12）

Bash（1）

命令（Commond）（7）

服务器（32）

Linux内核（0）

vi_gcc_gdb_emacs（3）

Makefile（8）
C_C++（41）

C++容器（7）
软件工程（3）

项目管理（0）

代码管理（3）
手机开发（131）

Android（18）

MTK（3）

Iphone（109）

Symbian（0）
游戏开发（154）

点阵字库（3）

环境搭建（1）

寻路算法（2）

字库相关（2）

Unity3D（17）

MD2_3D动画显示（1）

地图相关（11）

Hge Engine（0）

Cocos2d（14）

文件解析（3）

图片解析（11）

OpenGL（53）

游戏架构（1）
Web（18）

ECMAScript（1）

Flash（0）

Html5（11）
Java（49）

Jsp（6）

Eclipse（4）

J2ee_project（0）

文件上传（0）

UI（0）

J2ME（14）

reportTable（0）
kbengine（2）
Go（3）
Erlang（2）
Python（4）
OBJ_C（0）
PHP（23）
JavaScript（1）
Mac（5）
AdobeAir（1）
Photoshop（1）
WorkLog（12）
手机刷机（4）
美术学习（1）
数学知识（1）
游戏市场（5）
Windows（19）
Excel（5）
Database（34）
Embed（1）
English（0）
GTK+（0）
QT（12）
未分配的博文（104）

文章存档

2018年（6）

2017年（15）

2016年（2）

2015年（31）

2014年（14）

2013年（87）

2012年（75）

2011年（94）

2010年（190）

2009年（38）

2008年（183）

2007年（28）

我的朋友

相关博文

字节顺序:大端字节(big-endian)和小端字节(little-endian)

分类： C/C++

2010-03-24 12:24:26

今天碰一个关于字节顺序的问题,虽然看起来很简单,但一直都没怎么完全明白这个东西,索性就找了下资料,把它弄清楚.

因为现行的计算机都是以八位一个字节为存储单位,那么一个16位的整数,也就是C语言中的short,在内存中可能有两种存储顺序big-endian和litte-endian.考虑一个short整数0x3132(0x32是低位,0x31是高位),把它赋值给一个short变量,那么它在内存中的存储可能有如下两种情况:

大端字节(Big-endian):

----------------->>>>>>>>内存地址增大方向

short变量地址

0x1000 0x1001

_____________________________
| |
| 0x31 | 0x32
|________________ | ________________

高位字节在低位字节的前面,也就是高位在内存地址低的一端.可以这样记住(大端->高位->在前->正常的逻辑顺序)

小端字节(little-endian):

----------------->>>>>>>>内存地址增大方向

short变量地址

0x1000 0x1001

_____________________________
| |
| 0x32 | 0x31
|________________ | ________________
低位字节在高位字节的前面,也就是低位在内存地址低的一端.可以这样记住(小端->低位->在前->与正常逻辑顺序相反)

可以做个实验

在windows上下如下程序

#include

void main( void )

{
        short test;
        FILE* fp;

        test = 0x3132; //(31ASIIC码的’1’,32ASIIC码的’2’)

if ((fp = fopen ("c:\\test.txt", "wb")) == NULL)

              assert(0);
        fwrite(&test, sizeof(short), 1, fp);
        fclose(fp);

}

然后在C盘下打开test.txt文件,可以看见内容是21,而test等于0x3132,可以明显的看出来x86的字节顺序是低位在前.如果我们把这段同样的代码放到(big-endian)的机器上执行,那么打出来的文件就是12.这在本机中使用是没有问题的.但当你把这个文件从一个big-endian机器复制到一个little-endian机器上时就出现问题了.

如上述例子,我们在big-endian的机器上创建了这个test文件,把其复制到little-endian的机器上再用fread读到一个short里面,我们得到的就不再是0x3132而是0x3231了,这样读到的数据就是错误的,所以在两个字节顺序不一样的机器上传输数据时需要特别小心字节顺序,理解了字节顺序在可以帮助我们写出移植行更高的代码.

正因为有字节顺序的差别,所以在网络传输的时候定义了所有字节顺序相关的数据都使用big-endian,BSD的代码中定义了四个宏来处理:

#define ntohs(n) //网络字节顺序到主机字节顺序 n代表net, h代表host, s代表short

#define htons(n) //主机字节顺序到网络字节顺序 n代表net, h代表host, s代表short

#define ntohl(n) //网络字节顺序到主机字节顺序 n代表net, h代表host, s代表 long

#define htonl(n) //主机字节顺序到网络字节顺序 n代表net, h代表host, s代表 long

举例说明下这其中一个宏的实现:
#define sw16(x) \
    ((short)( \
        (((short)(x) & (short)0x00ffU) << 8) | \
        (((short)(x) & (short)0xff00U) >> 8) ))

这里实现的是一个交换两个字节顺序.其他几个宏类似.

我们改写一下上面的程序

#include

#define sw16(x) \

    ((short)( \
        (((short)(x) & (short)0x00ffU) << 8) | \
        (((short)(x) & (short)0xff00U) >> 8) ))

// 因为x86下面是低位在前,需要交换一下变成网络字节顺序

#define htons(x) sw16(x)

void main( void )

{
short test;
FILE* fp;

        test = htons(0x3132); //(31ASIIC码的’1’,32ASIIC码的’2’)
        if ((fp = fopen ("c:\\test.txt", "wb")) == NULL)

              assert(0);
        fwrite(&test, sizeof(short), 1, fp);
        fclose(fp);

}

如果在高字节在前的机器上,由于与网络字节顺序一致,所以我们什么都不干就可以了,只需要把#define htons(x) sw16(x)宏替换为 #define htons(x) (x).

一开始我在理解这个问题时,总在想为什么其他数据不用交换字节顺序?比如说我们write一块buffer到文件,最后终于想明白了,因为都是unsigned char类型一个字节一个字节的写进去,这个顺序是固定的,不存在字节顺序的问题,够笨啊..

阅读(1682) | 评论(0) | 转发(0) |

上一篇：锚点的理解 J2me anchor

下一篇：ASCII码表

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6