2008年(909)
分类:
2008-05-06 22:18:00
楔子
去年,周星星大哥曾经在VCKBASE/C 论坛发表过一篇文章“数组引用"以避免"数组降阶”,当时我不能深入理解这种用法的含义;时隔一年,我的知识有几经锤炼,终于对此文章渐有所悟,所以把吾所知作想详细道来,竟也成了一篇文章。希望本文能对新手有所启迪,同时也希望大家发现本文中的疏漏之处后不吝留言指教。
故事起源于周星星大哥给出的两个Demo,为了节省地方,我把两个Demo合二为一,也能说明同样的问题:
#include其运行结果如下:using namespace std; void Foo1(int arr[100]) { cout << "pass by pointer: " << sizeof(arr) << endl; } void Foo2(int (&arr)[100]) { cout << "pass by reference: " << sizeof(arr) << endl; } void main() { int a[100]; cout << "In main function : " << sizeof(a) << endl; Foo1(a); Foo2(a); }
In main function : 400 pass by pointer: 4 pass by reference: 400这段代码说明了,如果数组形参是数组名形式(或者指针形式,下文讨论)时,使用sizeof运算符,将得不到原来数组的长度;如果用传递原数组引用的方法,则没有问题。
void Foo(int a); Foo(10);这里的a叫做形式参数(parameter),简称形参;这里的10叫做实际参数(argument),简称实参。形参和式参之间是什么关系呢?他们是赋值的关系,也就是说:把实参传递给形参的过程,可以看作是把实参赋值给形参的过程。上面的例子中,实参10传递给形参a,就相当于a=10;这个赋值的过程。(因为数据类型多的很,无法举例子举全面,所以这里就不举例子了;如果觉得不好理解,就在vc中写个sample调试一下各种数据类型的情况,你就能够验证这个结论了。)
int a[100]; int *b;这两者并不等价,第一句话声明了数组a,并定义了这个数组,它有100个int型元素,sizeof(a)将得到整个数组所占的内存大小,是400;第二句话只是声明并定义了一个int型的指针,sizeof(b)将得到这个指针所占的内存大小,是4。所以说,虽然数组名在表达式中一般会当作指针来处理,但是数组名和指针还是有差距的,最起码有a==&a[0]但是sizeof(a)!=sizeof(a[0])。
void Foo1(int arr[100]){} void Foo2(int arr[]){} void Foo3(int *arr){} C 尽可能的全面兼容C语言,所以这一部分的语法相同。三、引用的意义
#include下面是运行的结果,以供参考:using namespace std; void main() { int a = 10; int & a_ref = a; int b = 20; // 定义引用时就要初始化,说明引用跟它指向的元素密不可分 //int & b_ref ; // error C2530: ''b_ref'' : references must be initialized int & b_ref = b; int * p; int * q; //下面的结果证明了:引用一经定义,就不能再指向其他目标; //把一个引用b_ref赋值给另一个引用a_ref,其实就是把b赋值给了a. cout << a_ref << " " << b_ref << endl; a_ref = b_ref; cout << a_ref << " " << b_ref << endl; cout << a << " " << b << endl; cout << endl; //即使对一个引用a_ref取地址,取得也是a的地址。已经“恶鬼附体”了:) p = &a; q = &a_ref; cout << p << " " << q << endl; cout << endl; //下面这段代码展示了指针与引用的不同 p = &a; q = &b; cout << p << " "<< q << endl; p = q; cout << p << " "<< q << endl; cout << endl; system("pause"); }
10 20 20 20 20 20 0012FED4 0012FED4 0012FED4 0012FEBC 0012FEBC 0012FEBC四、声明和表达式的关系
#include大结局using namespace std; typedef int INTARR[100]; //这个,这个...也可以用表达式来理解,有点“GNU is not UNIX“的味道是吧? void Foo(INTARR &arr) //noh,这样看就很明白了,就是传了个引用进去 { cout << "pass by reference: " << sizeof(arr) << endl; } void main() { INTARR a; //用类型别名来定义a INTARR &a_ref=a; //用类型别名来定义引用a_ref cout << "In main function : " << sizeof(a) << endl; Foo(a); system("pause"); }
#include怎么样,是不是对输出结果感到很自然呢?如果是,那就好办了。我总结一下就下课哈!^_^ 数组名在表达式中,往往被当作是指向首元素a[0]地址的指针,但是在sizeof(a)中,返回的结果是数组a占用内存的大小;pa是指向a的指针,他也指向a[0],但是sizeof(pa)中,返回结果是pa这个指针所占内存空间的大小,之所以这样,因为pa这个指针和数组a的结合不够紧密,属于访问数组a的第二被选方案;a_ref这个引用,就是对数组a的引用,就像“恶鬼附体”一样,一旦附体附上了,你怎么也甩不掉它,对它的任何操作,全部都反映在a上。在看本文最初的那个例子,比这个例子所增加的操作就是函数实参到形参的传递,我们在上面说过了,从实参到形参的传递可以看作是把实参赋值给形参。所以本文最初的那个例子,其实际的操作过程就和本文最后的这个例子是一样的。所以,并非函数把数组给“降阶”了,而是它原原本本就该这样,千万不必奇怪。 :pusing namespace std; void main() { int a[100]; int * pa = a; int (&a_ref)[100] = a; cout << sizeof(a) << endl; cout << sizeof(pa) << endl; cout << sizeof(a_ref) << endl; system("pause"); }
方法是灵活多变的,关键看人怎么用了。C老爹Dennis Ritchie曾经说过:C诡异离奇,缺陷重重,却获得了巨大的成功。
注1:本文将不再引用“降阶”这个术语,原因是我认为这个“降阶”的概念有种把类似2维数组压扁到1维的意思,其实本文讨论的并不是这个问题,本文讨论的是数组形参传递过程中数组长度损失的问题(这么说也不准确,还是看文中的讨论吧)。
注2:C语言的编译器遇到数组元素arr[i],就会替换成*(arr i)的形式。