Chinaunix首页 | 论坛 | 博客
  • 博客访问: 4241820
  • 博文数量: 176
  • 博客积分: 10059
  • 博客等级: 上将
  • 技术积分: 4681
  • 用 户 组: 普通用户
  • 注册时间: 2006-03-24 12:27
文章分类

全部博文(176)

文章存档

2012年(1)

2011年(4)

2010年(14)

2009年(71)

2008年(103)

分类: C/C++

2009-07-23 15:10:33


我们摒弃了CURL的同步调用机制,自己使用 select I/O 接管了 CURL 收发数据的管理。具体上有一个 CURLService 调度线程(线程池), 里面有若干 CURLWorkThread 工作线程,每一个CURL任务都实例化一个 CURLWork 工作任务放入线程池工作。

开始的时候,调用 curl_multi_socket_action 会建立一个 socket(fd),
curl_multi_socket_action 函数返回前会调用我们自己的 sock_cb 回调函数,
我们在 sock_cb 中就可以取得刚建立好的 socket(fd)。然后将这个 socket(fd) 与之对应的 CURLWork 建立关系管理起来。
然后在 CURLService 调度线程里做 select 调度,从而实现了 CURL 的异步调用。

开始的时候还可以正常工作,后来,却出现了 10038 错误(winsock,)MSDN上 10038 错误的说明:
Socket operation on nonsocket.
An operation was attempted on something that is not a socket. Either the socket handle parameter did not reference a valid socket, or for select, a member of an fd_set was not valid.

经过调试可以排除 “for select, a member of an fd_set was not valid.” 这个可能性,
那么问题原因定位到 socket(fd) 错误上,bad socket。

我们自己的程序没有修改socket(fd),更没有关闭连接,这迫使我们进入curl库内部,

我们尝试过,直接用ip代替url,是可以正常工作的。
可是用 url ,CURL库内部的dns解析也是正确的,可以正常解析出 url对应的ip,
值得指出的是,CURL库解析DNS是异步方式的,它会新建一个线程去单独做这个解析工作。
问题会出在哪里呢???

经过大半天的跟踪debug,发现curl库两次调用了socket函数返回sockfd,也就是说它建立了两个不同的sockfd,
而我们的程序在 sock_cb 中只有一次赋值,因为我们想当然的认为 curl 只为每一个任务建立一个连接(只有一个sockfd),

CURL为什么会两次建立socket呢?

了解到,CURL第一个调用 curl_multi_socket_action, 就会建立一个socket(fd),然后调用 sock_cb 通知我们写的接口程序,
这样外部程序就可以做select调度。这个socket(fd)并没有做连接工作,但是外面的select调度却可以捕捉到该sockfd的事件,
这是最令人迷惑的地方,外部以为这个sockfd是正常的(实际上是不正常的)。
下次外部再次(或再几次)调用 curl_multi_socket_action 的时候,curl内部又建立一个socket,这个socket才是真正做我们的事情,
连接、发送、接收数据。

可是这个socket(fd)我们外部程序并没有捕捉到,还是用原有的那个socket(fd)做select,结果就出现 10038 错误。

我们把curl后来建立的那个socket(fd)再次与CURLWork绑定,给select做调度,解决问题。

中间还有一个小插曲,再次绑定后并没有立刻解决问题,后来找到原因,我们的CURLWork与socket(fd)绑定的时候,
是通过一个map给select的,原来的那个socket(fd)继续在map表里。



回过头来看看,正是因为curl的dns解析是异步的,如果解析过程非常快,那么它一开始调用sock_cb函数通知外部程序的时候,
那个socket(fd)就是第二个建立好的socket,如果解析过程慢了,它内部会返回一个临时的socket(fd),
等待第二次调用 curl_multi_socket_action,我们的问题正是由于dns解析慢了,curl返回了一个临时的socket(fd)给外部做select,
等它真正建立好socket的时候,我们却没有及时跟新select fdset里面的那个socket(fd),从而导致问题的出现。
阅读(10827) | 评论(1) | 转发(0) |
给主人留下些什么吧!~~

月夜雨2018-08-24 15:50:12

看了下,目前在用这个库,可能还真会有这问题