Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1686499
  • 博文数量: 782
  • 博客积分: 2455
  • 博客等级: 大尉
  • 技术积分: 4140
  • 用 户 组: 普通用户
  • 注册时间: 2011-04-06 21:37
个人简介

Linux ,c/c++, web,前端,php,js

文章分类

全部博文(782)

文章存档

2015年(8)

2014年(28)

2013年(110)

2012年(307)

2011年(329)

分类:

2012-01-06 09:09:22

原文地址:sizeof和strlen的区别 作者:ibychance

今天在做项目的过程中遇到了一些关于strlen与sizeof的问题,特地的查证了一下,比较了他们的区别
看了很多人的博客,发现他们大都从这两个关键词的使用情景来考察,而本文将会从他们的源码角度,对这两个关键词进行分析。
 
strlen的源码来自于Lib/string.c中,是一个函数
size_t strlen(const char *s)
{
    const char *sc;
    for (sc = s; sc != '\0'; s++);
 
    return sc - s;
}
 
而sizeof是编译器由定义的一个操作符,主要是由编译器识别出sizeof括号内的符号是表达式(变量),数组,结构体/对象,还是类型,并分别得这些符号在内存中占用内存的值。
举例来说,对于类型
#define mysizeof(type) ((char *)((type *)(1) + 1) - (char *)((type *)(1)))
对于变量
#define mysizeof(var) ((char *)(&(var) + 1) - (char *)&(var))
对于结构体,还要进行padding,具体的伪代码见
 
从上面的两个关键词的来源可以看到
strlen以字符为单位,依次寻找指针指向内存中的'\0',直到找到为止,并计算出不包含'\0’的字符个数
sizeof是编译器识别出符号的类型后,进行求内存大小的操作。
 
以下面的代码为例,介绍sizeof与strlen容易混淆的地方。
下面的代码在Ubuntu 10.10上进行了测试
 
  1. #include <stdio.h>
  2. #include <string.h>

  3. int main()
  4. {
  5.     int a[10];
  6.     char buf[10] = "hello";
  7.     char *c = "hello";
  8.     char d[] = "hello";
  9.     a[0] = 0xf0f0f0f0f;
  10.     a[1] = 0xf0f0f0f0f;
  11.     a[2] = '\0';
  12.     printf("sizeof a[10] is %d\n", sizeof(a));
  13.     printf("sizeof buf[10] is %d\n", sizeof(buf));
  14.     printf("sizeof c is %d\n", sizeof(c));
  15.     printf("sizeof d[] is %d\n", sizeof(d));
  16.     printf("strlen a[10] is %d\n", strlen(a));
  17.     a[0] = 'b';
  18.     printf("strlen a[10] is %d\n", strlen(a));
  19.     printf("strlen buf[10] is %d\n", strlen(buf));
  20.     printf("strlen c is %d\n", strlen(c));
  21.     printf("strlen d[] is %d\n", strlen(d));
  22.     return 0;
  23. }
得到结果如下:
  1. sizeof a[10] is 40
  2. sizeof buf[10] is 10
  3. sizeof c is 4
  4. sizeof d[] is 6
  5. strlen a[10] is 8
  6. strlen a[10] is 1
  7. strlen buf[10] is 5
  8. strlen c is 5
  9. strlen d[] is 5

结果解释:

先讨论sizeof:

对于数组,sizeof会自动识别他们的类型,得出数组以char为单位的长度值

对于通过buffer[10]和char *c表示的字符串,他们sizeof后的值是不一样的,因为他们代表不用的意义,sizeof(buffer)表示求buffer[10]数组的长度;sizeof(c)表示求指针c的长度。

而char d[] = "hello"中d是一个数组,它有6个元素,最后一个元素是'\0',所以sizeof的结果是6。

 

再讨论strlen, 对于整数数组,他们仍然是以字符为单位搜索内存中的'\0'字符,考虑到int a[10]数组在内存中的值:

当strlen搜索到第9个字符时,遇到'\0'字符,停止索索,故strlen(a)为8。

当a[0]='b'时,内存中的值为:

由于X86系统是小端模式,即高位存储在高地址处,那么strlen(a)时会首先搜索到一个ascii码为0x62的值,然后发现字符'\0',停止搜索,得到strlen(a)=1的结果。

下面要注意的是strlen("hello")的结果是5,即不会包含'\0'字符。

 

阅读(310) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~