Chinaunix首页 | 论坛 | 博客
  • 博客访问: 75104
  • 博文数量: 15
  • 博客积分: 1410
  • 博客等级: 上尉
  • 技术积分: 265
  • 用 户 组: 普通用户
  • 注册时间: 2008-09-21 18:15
文章分类

全部博文(15)

文章存档

2009年(8)

2008年(7)

我的朋友

分类: C/C++

2009-03-12 21:50:19

介绍
大多程序员在学C++前都学过C,并且习惯于C风格(类型)转换。当写C++(程序)时,有时候我们在使用static_cast<>和 reinterpret_cast<>时可能会有点模糊。在本文中,我将说明static_cast<>实际上做了什么,并且指出一些将会导致错误的情况。

泛型(Generic Types)

float f = 12.3;

float* pf = &f;


// static cast<>
// 成功编译, n = 12
int n = static_cast(f);
// 错误,指向的类型是无关的(译注:即指针变量pf是float类型,现在要被转换为int类型) //int* pn = static_cast(pf);
//成功编译
void* pv = static_cast(pf);
//成功编译, 但是 *pn2是无意义的内存(rubbish)
int* pn2 = static_cast(pv);



// reinterpret_cast<>
//错误,编译器知道你应该调用static_cast<>
//int i = reinterpret_cast(f);
//成功编译, 但是 *pn 实际上是无意义的内存,和 *pn2一样
int* pi = reinterpret_cast(pf);

简而言之,static_cast<> 将尝试转换,举例来说,如float-到-integer,而reinterpret_cast<>简单改变编译器的意图重新考虑那个对象作为另一类型。

指针类型(Pointer Types)

指针转换有点复杂,我们将在本文的剩余部分使用下面的类:

class CBaseX

{

public:

int x;

CBaseX() { x = 10; }

void foo() { printf("CBaseX::foo() x=%d\n", x); }

};


class CBaseY
{
public:
int y;
int* py;
CBaseY() { y = 20; py = &y; }
void bar() { printf("CBaseY::bar() y=%d, *py=%d\n", y, *py); }
};



class CDerived : public CBaseX, public CBaseY
{
public:
int z;
};

情况1:两个无关的类之间的转换

// Convert between CBaseX* and CBaseY*

// CBaseX* 和 CBaseY*之间的转换

CBaseX* pX = new CBaseX();

// Error, types pointed to are unrelated

// 错误, 类型指向是无关的

// CBaseY* pY1 = static_cast(pX);

// Compile OK, but pY2 is not CBaseX

// 成功编译, 但是 pY2 不是CBaseX

CBaseY* pY2 = reinterpret_cast(pX);

// System crash!!

// 系统崩溃!!

// pY2->bar();

正如我们在泛型例子中所认识到的,如果你尝试转换一个对象到另一个无关的类static_cast<>将失败,而reinterpret_cast<>就总是成功“欺骗”编译器:那个对象就是那个无关类。

情况2:转换到相关的类

1. CDerived* pD = new CDerived();

2. printf("CDerived* pD = %x\n", (int)pD);

3.

4. // static_cast<> CDerived* -> CBaseY* -> CDerived*

//成功编译,隐式static_cast<>转换

5. CBaseY* pY1 = pD;

6. printf("CBaseY* pY1 = %x\n", (int)pY1);

// 成功编译, 现在 pD1 = pD

7. CDerived* pD1 = static_cast(pY1);

8. printf("CDerived* pD1 = %x\n", (int)pD1);

9.

10. // reinterpret_cast

// 成功编译, 但是 pY2 不是 CBaseY*

11. CBaseY* pY2 = reinterpret_cast(pD);

12. printf("CBaseY* pY2 = %x\n", (int)pY2);

13.

14. // 无关的 static_cast<>

15. CBaseY* pY3 = new CBaseY();

16. printf("CBaseY* pY3 = %x\n", (int)pY3);

// 成功编译,尽管 pY3 只是一个 "新 CBaseY()"

17. CDerived* pD3 = static_cast(pY3);

18. printf("CDerived* pD3 = %x\n", (int)pD3);

---------------------- 输出 ---------------------------

CDerived* pD = 392fb8

CBaseY* pY1 = 392fbc

CDerived* pD1 = 392fb8

CBaseY* pY2 = 392fb8

CBaseY* pY3 = 390ff0

CDerived* pD3 = 390fec



注意:在将CDerived*用隐式 static_cast<>转换到CBaseY*(第5行)时,结果是(指向)CDerived*(的指针向后) 偏移了4(个字节)(译注:4为int类型在内存中所占字节数)。为了知道static_cast<> 实际如何,我们不得不要来看一下CDerived的内存布局。

CDerived的内存布局(Memory Layout)



如图所示,CDerived的内存布局包括两个对象,CBaseX 和 CBaseY,编译器也知道这一点。因此,当你将CDerived* 转换到 CBaseY*时,它给指针添加4个字节,同时当你将CBaseY*转换到CDerived*时,它给指针减去4。然而,甚至它即便不是一个CDerived你也可以这样做。
当然,这个问题只在如果你做了多继承时发生。在你将CDerived转换 到 CBaseX时static_cast<> 和 reinterpret_cast<>是没有区别的。

情况3:void*之间的向前和向后转换

因为任何指针可以被转换到void*,而void*可以被向后转换到任何指针(对于static_cast<> 和 reinterpret_cast<>转换都可以这样做),如果没有小心处理的话错误可能发生。

CDerived* pD = new CDerived();

printf("CDerived* pD = %x\n", (int)pD);



CBaseY* pY = pD; // 成功编译, pY = pD + 4
printf("CBaseY* pY = %x\n", (int)pY);



void* pV1 = pY; //成功编译, pV1 = pY
printf("void* pV1 = %x\n", (int)pV1);



// pD2 = pY, 但是我们预期 pD2 = pY - 4
CDerived* pD2 = static_cast(pV1);
printf("CDerived* pD2 = %x\n", (int)pD2);
// 系统崩溃
// pD2->bar();

---------------------- 输出 ---------------------------

CDerived* pD = 392fb8

CBaseY* pY = 392fbc

void* pV1 = 392fbc

CDerived* pD2 = 392fbc



一旦我们已经转换指针为void*,我们就不能轻易将其转换回原类。在上面的例子中,从一个void* 返回CDerived*的唯一方法是将其转换为CBaseY*然后再转换为CDerived*。
但是如果我们不能确定它是CBaseY* 还是 CDerived*,这时我们不得不用dynamic_cast<> 或typeid[2]。

总结:
C++通过指针来访问成员的过程,实际上是根据指针的类型,找到改类定义,并从中找到要访问的成员的地址偏移,然后从对象指针开始加上偏移,便得到了成员的地址,然后进行访问操作。
所以类定义的作用之一在于,确定成员的内存偏移。

static_cast会在编译期将指针在类的内存空间内移动,并最终指向到你转换到的内存上。在上面的例子中,当将CDerived*的指针转型为Y*型指针时,实际上将指针的数值修改了,指向了内存中Y类的开头位置。当使用转换后的指针访问Y的成员时,先到Y类定义查到Y的内存分布,然后进行指针便宜,访问。一切都是正确的。

reinterpret_cast并不会在转型是修改指针的值,而是告诉编译期,这个指针是某个类型的指针,仅此而已。所以当使用此转型方式转换CDerived*的指针到Y*类型时,指针仍然指向原来的位置,即CDerived*的开头,也是A*的开头。这时如果访问Y*的成员y,那么先到Y上查到y的地址偏移为一个整型的字节大小(一般是4),那么你实际是将指针偏移到了X类的x成员处,访问的是x的内容。这种错误是编译器不明白的,你的程序即将崩溃。

所以,请谨慎使用reinterpret_cast。
阅读(1734) | 评论(0) | 转发(0) |
0

上一篇:【转】select系统调用

下一篇:哈佛结构

给主人留下些什么吧!~~