分类:
2008-10-13 16:07:01
深入理解sizeof
作者:
最近在论坛里总有人问关于sizeof的问题,并且本人对这个问题也一直没有得到很好的解决,索性今天对它来个较为详细的总结,同时结合strlen进行比较,如果能对大家有点点帮助,这是我最大的欣慰了。
一、好首先看看sizeof和strlen在MSDN上的定义:
首先看一MSDN上如何对sizeof进行定义的:
sizeof Operator sizeof expression The sizeof keyword gives the amount of storage, in bytes, associated with a variable or a type (including aggregate types). This keyword returns a value of type size_t. The expression is either an identifier or a type-cast expression (a type specifier enclosed in parentheses). When applied to a structure type or variable, sizeof returns the actual size, which may include padding bytes inserted for alignment. When applied to a statically dimensioned array, sizeof returns the size of the entire array. The sizeof operator cannot return the size of dynamically allocated arrays or external arrays.
然后再看一下对strlen是如何定义的:
strlen Get the length of a string. Routine Required Header: strlen二、由几个例子说开去。size_t strlen( const char *string ); Parameter string:Null-terminated string Libraries All versions of the C run-time libraries. Return Value Each of these functions returns the number of characters in string, excluding the terminal NULL. No return value is reserved to indicate an error. Remarks Each of these functions returns the number of characters in string, not including the terminating null character. wcslen is a wide-character version of strlen; the argument of wcslen is a wide-character string. wcslen and strlen behave identically otherwise.
char* ss = "0123456789"; sizeof(ss) 结果 4 ===》ss是指向字符串常量的字符指针 sizeof(*ss) 结果 1 ===》*ss是第一个字符 char ss[] = "0123456789"; sizeof(ss) 结果 11 ===》ss是数组,计算到\0位置,因此是10+1 sizeof(*ss) 结果 1 ===》*ss是第一个字符 char ss[100] = "0123456789"; sizeof(ss) 结果是100 ===》ss表示在内存中的大小 100×1 strlen(ss) 结果是10 ===》strlen是个函数内部实现是用一个循环计算到\0为止之前 int ss[100] = "0123456789"; sizeof(ss) 结果 400 ===》ss表示再内存中的大小 100×4 strlen(ss) 错误 ===》strlen的参数只能是char* 且必须是以''\0''结尾的 char q[]="abc"; char p[]="a\n"; sizeof(q),sizeof(p),strlen(q),strlen(p); 结果是 4 3 3 2第二个例子:
class X { int i; int j; char k; }; X x; cout<第三个例子: char szPath[MAX_PATH]如果在函数内这样定义,那么sizeof(szPath)将会是MAX_PATH,但是将szPath作为虚参声明时(void fun(char szPath[MAX_PATH])),sizeof(szPath)却会是4(指针大小)
三、sizeof深入理解。四、结束语
- 1.sizeof操作符的结果类型是size_t,它在头文件中typedef为unsigned int类型。该类型保证能容纳实现所建立的最大对象的字节大小。
- 2.sizeof是算符,strlen是函数。
- 3.sizeof可以用类型做参数,strlen只能用char*做参数,且必须是以''\0''结尾的。sizeof还可以用函数做参数,比如:
short f(); printf("%d\n", sizeof(f()));输出的结果是sizeof(short),即2。- 4.数组做sizeof的参数不退化,传递给strlen就退化为指针了。
- 5.大部分编译程序 在编译的时候就把sizeof计算过了 是类型或是变量的长度 这就是sizeof(x)可以用来定义数组维数的原因
char str[20]="0123456789"; int a=strlen(str); //a=10; int b=sizeof(str); //而b=20;- 6.strlen的结果要在运行的时候才能计算出来,时用来计算字符串的长度,不是类型占内存的大小。
- 7.sizeof后如果是类型必须加括弧,如果是变量名可以不加括弧。这是因为sizeof是个操作符不是个函数。
- 8.当适用了于一个结构类型时或变量, sizeof 返回实际的大小, 当适用一静态地空间数组, sizeof 归还全部数组的尺 寸。 sizeof 操作符不能返回动态地被分派了的数组或外部的数组的尺寸
- 9.数组作为参数传给函数时传的是指针而不是数组,传递的是数组的首地址,如:
fun(char [8]) fun(char [])都等价于 fun(char *) 在C++里传递数组永远都是传递指向数组首元素的指针,编译器不知道数组的大小 如果想在函数内知道数组的大小, 需要这样做: 进入函数后用memcpy拷贝出来,长度由另一个形参传进去fun(unsiged char *p1, int len) { unsigned char* buf = new unsigned char[len+1] memcpy(buf, p1, len); }有关内容见: C++ PRIMER?- 10.计算结构变量的大小就必须讨论数据对齐问题。为了CPU存取的速度最快(这同CPU取数操作有关,详细的介绍可以参考一些计算机原理方面的书),C++在处理数据时经常把结构变量中的成员的大小按照4或8的倍数计算,这就叫数据对齐(data alignment)。这样做可能会浪费一些内存,但理论上速度快了。当然这样的设置会在读写一些别的应用程序生成的数据文件或交换数据时带来不便。MS VC++中的对齐设定,有时候sizeof得到的与实际不等。一般在VC++中加上#pragma pack(n)的设定即可.或者如果要按字节存储,而不进行数据对齐,可以在Options对话框中修改Advanced compiler页中的Data alignment为按字节对齐。
- 11.sizeof操作符不能用于函数类型,不完全类型或位字段。不完全类型指具有未知存储大小的数据类型,如未知存储大小的数组类型、未知内容的结构或联合类型、void类型等。 如sizeof(max)若此时变量max定义为int max(),sizeof(char_v) 若此时char_v定义为char char_v [MAX]且MAX未知,sizeof(void)都不是正确形式
sizeof使用场合。
- 1.sizeof操作符的一个主要用途是与存储分配和I/O系统那样的例程进行通信。 例如:
void *malloc(size_t size), size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream)。- 2.用它可以看看一类型的对象在内存中所占的单元字节。
void * memset(void * s,int c,sizeof(s))- 3.在动态分配一对象时,可以让系统知道要分配多少内存。
- 4.便于一些类型的扩充,在windows中就有很多结构内型就有一个专用的字段是用来放该类型的字节大小。
- 5.由于操作数的字节数在实现时可能出现变化,建议在涉及到操作数字节大小时用sizeof来代替常量计算。
- 6.如果操作数是函数中的数组形参或函数类型的形参,sizeof给出其指针的大小。
--------------------next---------------------
int,long,float等类型的变量在内存中是以偶地址对齐存储的,byte变量没有限制。
当结构体中完全是byte或者完全是int,long,float的话,中间是没有内存空隙的。如果同时包含byte和int两种,这时候就有可能存在内存空隙。
用上边楼主的例子来讲:
class X
{
int i;
int j;
char k;
};
X x;
其中 i占4个byte j占4个byte k表面上占1个byte
但是后边的地址是奇数,其他的数据若想要使用,必须后退3个字符,也就是说k实际上占用了4个byte
所以最后的结果是12
( fishinnor 发表于 2008-10-10 11:02:00)
cout<cout< 上边对齐是如何进行的? ( fidel 发表于 2008-6-26 12:00:00)
好是好,不过没有做UNICODE的分析。
如果使用了UNICODE
TCHAR ss[100] = _T("Hello");
sizeof(ss) = = ?
lstrlen(ss) = = ? ( sdhexu 发表于 2007-5-6 19:18:00)
。。。编译器不知道数组的大小如果想在函数内知道数组的大小, 需要这样做:进入函数后用memcpy拷贝出来,长度由另一个形参传进去 fun(unsiged char *p1, int len)
{
unsigned char* buf = new unsigned char[len+1]
memcpy(buf, p1, len);
}
这个说得莫名其妙!! ( cdlgz 发表于 2006-7-17 15:46:00)
很好,但如何补齐没有说。 ( genghiskhan 发表于 2006-5-29 8:40:00)
好,不过看不懂,初学者 ( jackcf 发表于 2004-7-5 16:02:00)
... ( nstar 发表于 2004-3-27 23:33:00)
真不错!
希望这位仁兄能够多多的发表一些类似的文章。
( Shawnson.zhang 发表于 2004-3-26 18:51:00)
写的好 ( y5318 发表于 2004-3-18 7:45:00)
不错!
( xiaojin 发表于 2004-3-17 15:01:00)
.......................................................
--------------------next---------------------