0长数组-snailshen-ChinaUnix博客

snailshensnailshen.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

snailshen

博客访问： 293361
博文数量： 72
博客积分： 2387
博客等级：大尉
技术积分： 720
用户组：普通用户
注册时间： 2010-08-26 10:54

文章分类

全部博文（72）

系统（1）

aix（1）
开发遇到的问题（11）
开发知识（15）

线程（1）

基础知识（5）

动态库（3）

杂（6）
编程语言（7）

好的用法（3）

c/cpp（0）

算法（2）

STL（2）
网络（2）
数据库（31）

日常维护（5）

pl/sql开发（15）

知识点（11）

oracle（0）
未分配的博文（5）

文章存档

2012年（1）

2011年（1）

2010年（70）

我的朋友

最近访客

推荐博文

0长数组

分类：

2010-08-26 12:48:33

1.零长数组代码片段
#include

#include

struct helloworld_t

{

int num;

char helloworld[0];

};

int main()

{

struct helloworld_t *p;

unsigned int size = sizeof(struct helloworld_t) + sizeof("Hello World!\n");

p = (struct helloworld_t *) malloc(size);

if (!p)

return -1;

memcpy(p, "\x01\x00\x00\x00Hello World!\n", size);

while (p->num--)

{

printf("%s",p->helloworld);

}

free(p);

return 0;

}

---零长数组
gcc方言零长数组就是零长数组，有基址没尺寸，不是指针。#include

struct stTest

{

int iA;

int iB;

char ar[0];

int iC;

};

struct stTest stA;

int main(void)

{

printf("&stA: %p\n", &stA);

printf("&stA.ar: %p\n", &stA.ar[0]);

printf("&stA.iC: %p\n", &stA.iC);

}
复制代码&stA: 0x8049600
&stA.ar: 0x8049608
&stA.iC: 0x8049608

-----------------------一些知识

1. 这东西叫什么名字我忘了…… 有点像转义int a = '\x12';

int b = 0x12;

assert( a==b );
复制代码char const* a = "\x12\x12";

char const b[] = { 0x12, 0x12, 0x0 };

assert( strlen(a)==strlen(b) );

assert( strlen(b)+1==sizeof b );

assert( memcmp(a, b, sizeof b) == 0 );
复制代码2. 类型的表示

假设int是4字节，且用二进制补码表示。int a = 0x120326;

// a是由4个字节组成，从高权到低权依次是0x00, 0x12, 0x03, 0x26。

// 如果是大端，内存中的布局是高权在低地址

unsigned char b[] = {0x00, 0x12, 0x03, 0x26 };

assert( memcmp(&a, b, sizeof a) == 0 );

// 如果是小端，内存中的布局是低权在低地址

unsigned char b[] = {0x26, 0x03, 0x12, 0x00};

assert( memcmp(&a, b, sizeof a) == 0 );
复制代码3. 数组与指针

数组与指针的区别可以说一大堆。
但最容易理解的，恰好是它们在结构中的不同行为。typedef struct

{

int i;

char c[8];

} A;

typedef struct

{

int i;

char* c;

} B;
复制代码还是设int是4字节， A的布局是：?? ?? ?? ?? ?? ?? ?? ?? ... ???

<- i -> <- 8字节 c ->

< A ->
复制代码再设指针也是4字节，且对齐需求与int相同，那B的布局是：?? ?? ?? ?? ?? ?? ?? ??

<- i -> <- c ->

< B ->
复制代码这样，下面的代码应该就好理解了：char layout[sizeof(A)] = { 0x26, 0x03, 0x12, 0x00, 'h' , 'e' , 'l', 'l', 'o', ' ', 'c', 0 };

A a;

memcpy(&a, layout, sizeof a);
复制代码前4个字节是i，所以复制完毕后， a.i就是0x00120326（小端，其他假设同上）。
a.c就是余下的内容，一个c-style-string "hello c"

将中间的layout步骤省去：A a;

memcpy(&a, "\x26\x03\x12\x00hello c\x00" , sizeof a);
复制代码就差不多是那个样子了。
最后一个\x00是多余的， "literal" 本来末尾就有一个0。

4. flexible array memberA a;

assert( a.c == (char*)&a + offsetof(A, c) );
复制代码即a.c的地址，是a的地址加上c在A中的偏移。B b;

char* p = *(char**)( (char*)&b + offsetof(B, c) );

assert( b.c == p );
复制代码将c在B中的偏移处的内容，理解为一个指针，该指针的值就是b.c的地址。

故A可以存放一个整数与一个长度不超过7的c-style-string。
而B可以存放一个整数与一个指针，指针由可以存放另一块内存的地址。

上面的a的布局是：0x26 0x03 0x12 0x00 "hello c"

<- i -> <- c ->

< a ->
复制代码而B的布局：B b;

b.i = 0x120326;

void* p = malloc( sizeof("hello c") );

b.c = p;

memcpy(p, "hello c", sizeof("hello c") );

0x26 0x03 0x12 0x00 pp pp pp pp

<- i -> <- 值是p ->

<- b ->

p :

"hello c"
复制代码a中， 0x120326和 "hello c"的地址是连续的
b中，它们可能是分离的。

而以前的一些"聪明"的C程序员这样来实现一个变长且连续的整数、字符串pair：A* pa = malloc( offsetof(A, c) + 12 );
复制代码那么*pa的布局就是：pa:

?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ??

<- i -> <- c -> <- rest ->
复制代码理论上， pa->c只有8字节。
但pa->c是这8字节的首地址。
再根据指针运算， pa->c[8]就是rest的首地址。
所以，通过pa->c，其实可以操纵rest部分。
pa就可以存放一个整数与一个长度不超过11的c-style-string。

理论上， pa->c确实是一个8字节的数组，但被当成了12字节的数组。
虽然大部分情况下不会出问题，但这毕竟是一个类型漏洞，说不通。
比如， C89没有规定C实现一定不能添加数组长度检查。
如果真有C编译器去实现了，代码就要挂。

所以， C99把这个行为标准化，称为flexible array member。
语法是不指定维度：typedef struct

{

int i;

char c[];

} A99;
复制代码这样，编译器必须让这种"末尾是一个不定长成员"的做法合法。

C要求数组的维度>=1， 0长数组是gcc的方言。

阅读(1018) | 评论(0) | 转发(0) |

上一篇：unix.dos回车换行

下一篇：数值转换

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6