Socket库尝试之七-heiyou-ChinaUnix博客

放飞心情-FreeBSD and Windows

首页　| 　博文目录　| 　关于我

heiyou

博客访问： 1046383
博文数量： 178
博客积分： 3629
博客等级：中校
技术积分： 1850
用户组：普通用户
注册时间： 2005-02-23 21:21

文章分类

全部博文（178）

黑苹果（6）
新生活（1）
Unix平台（18）
精品开源（5）
里面啥都有（20）
DOTNET（20）
协议相关（5）
编程语言（1）
win32编程（24）
病毒日记（1）
协议分析（8）
软件使用（37）
实用技巧（32）
未分配的博文（0）

文章存档

2025年（1）

2021年（1）

2020年（5）

2019年（4）

2018年（7）

2017年（1）

2016年（4）

2014年（1）

2013年（8）

2012年（10）

2011年（50）

2009年（12）

2008年（10）

2006年（56）

2005年（8）

我的朋友

相关博文

Socket库尝试之七

分类： C/C++

2006-04-10 16:31:28

使用比HttpSocket更简单.

在HttpSocket基础上改的例子,也是下载一个URL文件,不过这儿更简单,只需要URL和文件名就可以得到了.

#include
#include
#include

using namespace std;

class MyHttp : public HttpGetSocket
{
public:
MyHttp(SocketHandler& h,string url,string filename): HttpGetSocket(h,url,filename) {}

};

int main()
{
SocketHandler h;
MyHttp Get(h,"http://www.cublog.cn/u/4466/?u=http://www.cublog.cn/u/4466/showart.php?id=97754","cublog.html");
h.Add(&Get);
h.Select(1,0);
while(h.GetCount()){
h.Select(1,0);
}

}

理解一下:

在HttpSocket类的基础上,HttpGetSocket重载了

OnHeader()

OnFirst()

OnContent()

OnConnect()

OnDelete()

OnHeaderComplete()

OnData()

这几个函数.

OnHeaderComplete()函数有意思,当HTTP头文件传输完后,这个函数被除数调用,它检查内定的文件名变量是否被赋值,如果已被赋值,它将自动打开一个可写文件,以二进制模式,把文件指针保存起来.

HttpSocket类里说过,OnData函数能接收HTTP实体部分.这儿也一样.只不过多了个OnContent的调用.在OnContent里检查文件指针是否有效,如有效则把数据写入此文件.

OnDelete函数里也有对OnContent的调用,保存一下已收到的数据这也是一个机会.

辅助函数

url_this,url这两个函数是把URL解析为内定变量,如host,port,file等.

SetDataPtr(),GetDataPtr()是设置缓冲区的,可以自己指定,也可以不指定.

不指定时会自动创建一个.无须费心.可以参考OnHeader一节

如果自己想处理细节,还是用HttpSocket类.看来看去,HttpGetSocket都是为了下载文件准备的,如果不用这个功能,不如直接用HttpSocket和TcpSocket.

由于HttpGetSocket下载大文件时会占用大量内存,如果下载200M的还可以接受,如果1G的话就不可想象了.下面是偶改的代码:下载208M的文件也只用10M以内的内存.

新加变量:

size_t m_minLimitOfWrite; ///< 这是偶自定的变量,到了1024*1024以上就写入文件并归零变量

修改OnData函数如下:

//只需设一个很小的自定义缓冲区,便会使 m_content_ptr + len > m_data_max 条件为真,从而避开memcpy.
void HttpGetSocket::OnData(const char *buf,size_t len)
{             //缓冲区iBuf已经接收了数据,把指针传过来,如果不是为了兼容原代码,这儿直接写文件即可.有些代码可删.
if (m_content_ptr + len > m_data_max)
{
  Handler().LogError(this, "OnData", -1, "content buffer overflow", LOG_LEVEL_ERROR);
}
else
{     //如果缓冲区太小不能容纳大量数据,则不写入缓冲区,直接写入文件.可以设一个小缓冲区避开memcpy
  memcpy(m_data + m_content_ptr, buf, len);
}     //如果我需要buf中的内容,直接重载OnData即可,这儿copy一下,内存利用不好

if (m_fil)
{
  fwrite(buf,1,len,m_fil);
}
m_content_ptr += len;
m_minLimitOfWrite += len;
if (m_content_length > 0 && (m_minLimitOfWrite>=(1024*1024) || m_content_ptr== m_content_length))
{      //自定义的 m_minLimitOfWrite>=(1024*1024) 使接收到1M字节就写入文件,对于大文件尤其重要
  OnContent();
  m_minLimitOfWrite =0;
}
}
修改OnContent函数如下:

void HttpGetSocket::OnContent() //在OnData中被调用,
{
if (m_fil)
{
  fflush(m_fil);                 //写入文件,只有HTTP实体部分
  if(m_content_ptr!= m_content_length) //这是偶加的,不收完继续,收完关闭文件
   return;
  fclose(m_fil);
}
m_fil = NULL;
SetCloseAndDelete(true);
m_bComplete = true;
}

使用时如下:

unsigned char buf[1];

...

HttpGetSocket get(.....);

get.SetDataPtr(buf,1);

用一个小缓冲区避开HttpGetSocket分配和下载文件一样大小的缓冲区.因为有了ibuf的缓冲区,所以我们不设自己的了,直接写入文件即可.

如果分配了缓冲区,还要从ibuf里往我们的缓冲区里copy,不知道原作者怎么考虑的?期待有人能给偶个解答.

哪天查查英语词典,上官方网发贴问一下.

猜想一下,如果不考虑大文件的话,仅对网页文件,原代码的效果还是很好的.空间换时间?偶不知道.

阅读(1749) | 评论(2) | 转发(0) |

上一篇：Socket库尝试之六

下一篇：VC6和WTL的故事

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6