深入C语言学习笔记——混乱的数组-mariolw-ChinaUnix博客

路遥之马里奥mlw.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

mariolw

博客访问： 144437
博文数量： 25
博客积分： 100
博客等级：中士
技术积分： 310
用户组：普通用户
注册时间： 2011-05-03 18:56

文章分类

全部博文（25）

USB（1）
操作系统（3）

Windows（0）

Nucleus（0）

Linux（0）

VxWorks（3）
开发环境（1）
语言艺术（8）
Web开发（5）
闲趣（6）
未分配的博文（1）

文章存档

2012年（4）

2011年（21）

我的朋友

相关博文

深入C语言学习笔记——混乱的数组

分类： C/C++

2011-05-24 19:21:06

指针和数组是非常容易混淆的两种数据类型，K&R和C专家编程里面的叙述都比较杂乱，没办法，因为C对于这两者的一些规定本身就很混乱。这里把我最近的学习成果整理一下。

1.声明与定义

指针的定义格式如下：

type_t *p = ?;
/*
这里的type_t可以任何C语言内嵌的类型，如int,char,也可以是结构体、函数等等；
?代表的可以是一个地址常数、一个&取址表达式、或者另一个指针、如果考虑强制类型转换它可以是任意的表达式或者变量。
定义产生的符号p即为指针型变量，他和unsigned long型的变量其实没有什么区别。一般来说就是一个32位的无符号整数,表示虚拟空间的某个地址值。
*/

数组的定义格式如下：

type_t a[100] = "mario love lulu";
/*
type_t 如前面所述；a即为数组名，其实作用于a的操作可以说是混乱的最大来源之一。
*/

Note1：数组在声明时可以不指定长度，因为声明时连接器还不需要决定为符号分配多少空间；

Note2：新的编译器允许动态指定数组长度，即数据定义时可以用一个变量来制定长度。

Note3：字符串"abc"的长度为4,它其实是'a' 'b' 'c' '\0'

Note4：a[] = "mario love lulu"这种初始化方法只允许与用于定义中，在表达式中不允许这样用，实际上，这种定义形式所包含的操作并没有被翻译成某些指令实现，而是通编译器直接组织数据段的方式来实现。

2.前面说的比较基础，大家可能觉得太简单了，下面来个真正的考题：

写出下面代码的输出：

#include <stdio.h>
char ga[] = "abcdefg";
void my_array_func(char ca[]){
printf("addr of array in routine = %#x\n",&ca);
printf("what is in this addr? %#x\n",ca);
printf("addr of first element of array in routine = %#x\n",&ca[0]);
printf("sizeof this array is %d\n",sizeof(ca));
}
main(){
printf("value of array symbol in invoker = %#x\n",ga);
printf("addr of array in invoker = %#x\n",&ga);
printf("addr of first elemnet of array in invoker = %#x\n",&ga[0]);
printf("sizeof this array is %d\n",sizeof(ga));
my_array_func(ga);
}
~

怎么样，结果是啥呢，这就来揭晓：

value of array symbol in invoker = 0x804a014
addr of array in invoker = 0x804a014
addr of first elemnet of array in invoker = 0x804a014
sizeof this array is 8
addr of array in routine = 0xbf93cb10
what is in this addr? 0x804a014
addr of first element of array in routine = 0x804a014
sizeof this array is 4

可以看到，同样一个数组，在传递给函数之前和在子函数内部,其行为特性完全不同了。

很明显，在调用函数之间，编译器对于表达式&ga，直接给出ga的值，也就是该数组的地址；

同时g[0]表示数组的第一个元素，它的地址也就是ga的值即0x804a014。调用sizeof时，程序从符号表里查到ga的大小，并且返回；

另一方面，在子函数中，由于C参数传递永远是传值，也就是传递一份拷贝，即使是传递地址是也是拷贝一个指针变量；同时编译器将所有数组实参全部转化成指向数组第一个元素的指针。在这两条规则的联合作用下，当我们调用my_array_func(ga)时，一个指向数组ga的指针产生了，这个时候，函数内部的参数ca就不再是一个“数组对象”，而是一个赤果果的指针，当然了根据编译器的设定，只要这个指针指向ga的首地址，那么用ga[i]和ca[i]将获得同样的访问效果。此时&ca这个表达式的值是存储ca这个指针变量的地址，也就是0xbf93cb10。而ca的值即为0x804a014。代码中sizeof(ca)等于4也验证了这一点。

综上所述，指针和数组之间的混乱，完全是由数组单方面引起的，指针的行为非常规范，且不存在歧义，而数组由于它流露出“面向对象”的特质，在C语言中的行为表现的无所适从。但是，无论如何，只要掌握几种基本机理，在编程时就能避免混乱的发生。

阅读(2723) | 评论(1) | 转发(1) |

上一篇：Vxworks在OMAP L137上的移植笔记(3) -- bootloader

下一篇：普适计算是信息社会的未来

给主人留下些什么吧！~~

yifangyou2011-05-25 12:33:10

学习了，以前一直把数组当指针使用

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6