突破select的FD_SETSIZE限制-ricky

ricky_pc

首页　| 　博文目录　| 　关于我

ricky_pc

博客访问： 712958
博文数量： 108
博客积分： 3236
博客等级：中校
技术积分： 906
用户组：普通用户
注册时间： 2010-05-04 21:23

文章分类

全部博文（108）

生活（1）
other（1）
协议（1）
流服务（3）
Coding（43）

执行程序Error（1）

Error（1）

访问数据库（3）

调试（1）

多线程编程（4）

基础（4）

网络相关函数（1）

Socket编程（20）

Linux库函数（5）

思想/技巧（2）

C/C++（0）
DataBase（1）

Mysql（1）
个人修养（励志）（2）
电脑技巧（1）
tools（3）
个人日记（1）
嵌入式（8）

QT（1）

ARM概述（2）

技术论坛（1）

开发产品（1）

madplay移植（0）

BootLoader（2）

JFFS2文件系统（1）
Linux（42）

完全使用Linux（0）

Shell（3）

Linux命令（12）

Linux Setting（3）

Linux学习经验（2）

中文支持&国际化（12）

Linux Applicatio（2）

NFS（1）

Linux推荐网页及（1）

FTP（3）

Server（0）

Linux Install（3）
未分配的博文（1）

文章存档

2011年（33）

2010年（75）

我的朋友

qxhgd

相关博文

突破select的FD_SETSIZE限制

分类： C/C++

2011-01-07 18:31:42

前言：

在很多比较各种网络模型的文章中，但凡提到select模型时，都会说select受限于轮询的套接字数量，这个
数量也就是系统头文件中定义的FD_SETSIZE值(例如64)。但事实上这个算不上真的限制。

C语言的偏方：

在C语言的世界里存在一个关于结构体的偏门技巧，例如：

typedef struct _str_type

{

int _len;

char _s[1];

}str_type;

str_type用于保存字符串(我只是举例，事实上这个结构体没什么用处)，乍看上去str_type只能保存长度为
1的字符串('\0')。但是，通过写下如下的代码，你将突破这个限制：

int str_len = 5;

str_type *s = (str_type*) malloc( sizeof( str_type ) + str_len - 1 );

free( s );

这个技巧原理很简单，因为_s恰好在结构体尾部，所以可以为其分配一段连续的空间，只要注意指针的使用，
这个就算不上代码上的罪恶。但是这个技巧有个限制，str_type定义的变量必须是被分配在堆上，否则会破
坏堆栈。另外，需要动态增长的成员需要位于结构体的末尾。最后，一个忠告就是，这个是C语言里的技巧，
如果你的结构体包含了C++的东西，这个技巧将不再安全()。

其实select也可以这样做：

事实上，因为select涉及到的fd_set是一个完全满足上述要求的结构体：

winsock2.h :

typedef struct fd_set {

u_int fd_count; /* how many are SET? */

SOCKET fd_array[FD_SETSIZE]; /* an array of SOCKETs */

} fd_set;

但是，如果使用了以上技巧来增加fd_array的数量(也就是保存的套接字数量)，那么关于fd_set的那些宏可
能就无法使用了，例如FD_SET。

winsock2.h :

#define FD_SET(fd, set) do { \

u_int __i; \

for (__i = 0; __i < ((fd_set FAR *)(set))->fd_count; __i++) { \

if (((fd_set FAR *)(set))->fd_array[__i] == (fd)) { \

break; \

} \

if (__i == ((fd_set FAR *)(set))->fd_count) { \

if (((fd_set FAR *)(set))->fd_count < FD_SETSIZE) { \

((fd_set FAR *)(set))->fd_array[__i] = (fd); \

((fd_set FAR *)(set))->fd_count++; \

} \

} while(0)

有点让人眼花缭乱，我鼓励你仔细看，其实很简单。这里有个小技巧，就是他把这些代码放到一个do...while(0)
里，为什么要这样做，我觉得应该是防止名字污染，也就是防止那个__i变量与你的代码相冲突。可以看出，
FD_SET会将fd_count与FD_SETSIZE相比较，这里主要是防止往fd_array的非法位置写数据。

因为这个宏原理不过如此，所以我们完全可以自己写一个新的版本。例如：

#define MY_FD_SET( fd, set, size ) do { \

unsigned int i = 0; \

for( i = 0; i < ((fd_set*) set)->fd_count; ++ i ) { \

if( ((fd_set*)set)->fd_array[i] == (fd) ) { \

break; \

} \

if( i == ((fd_set*)set)->fd_count ) { \

if( ((fd_set*)set)->fd_count < (size) ) { \

((fd_set*)set)->fd_array[i] = (fd); \

((fd_set*)set)->fd_count ++; \

} \

} while( 0 )

没什么变化，只是为FD_SET加入一个fd_array的长度参数，宏体也只是将FD_SETSIZE换成这个长度参数。
于是，现在你可以写下这样的代码：

unsigned int count = 100;

fd_set *read_set = (fd_set*) malloc( sizeof( fd_set ) + sizeof(SOCKET) * (count - FD_SETSIZE ) );

SOCKET s = socket( AF_INET, SOCK_STREAM, 0 );

MY_FD_SET( s, read_set, count );

free( read_set );

closesocket( s );

小提下select模型：

这里我不会具体讲select模型，我只稍微提一下。一个典型的select轮询模型为：

int r = select( 0, &read_set, 0, 0, &timeout );

if( r < 0 )

{

// select error

}

if( r > 0 )

{

for( each sockets )

{

if( FD_ISSET( now_socket, &read_set ) )

{

// this socket can read data

}

轮询write时也差不多。在Etwork(一个超小型的基本用于练习网络编程的网络库,google yourself)中，作者
的轮询方式则有所不同：

// read_set, write_set为采用了上文所述技巧的fd_set类型的指针

int r = select( 0, read_set, write_set, 0, &timeout );

error handling

for( int i = 0; i < read_set->fd_count; ++ i )

{

// 轮询所有socket，这里直接采用read_set->fd_array[i] == now_socket判断，而不是FD_ISSET

}

for( int i = 0; i < write_set->fd_count; ++ i )

{

// 轮询所有socket，检查其whether can write，判断方式同上

}

两种方式的效率从代码上看去似乎都差不多，关键在于，FD_ISSET干了什么？这个宏实际上使用了__WSAFDIsSet
函数，而__WSAFDIsSet做了什么则不知道。也许它会依赖于FD_SETSIZE宏，那么这在我们这里将是不安全的，
所以相比之下，如果我们使用了这个突破FD_SETSIZE的偏方手段，那么也许第二种方式要好些。

阅读(1860) | 评论(0) | 转发(0) |

上一篇：Valgrind 介绍

下一篇：Linux下select调用引发的血案

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6