Chinaunix首页 | 论坛 | 博客
  • 博客访问: 24049
  • 博文数量: 7
  • 博客积分: 320
  • 博客等级: 一等列兵
  • 技术积分: 90
  • 用 户 组: 普通用户
  • 注册时间: 2007-07-17 19:01
文章分类

全部博文(7)

文章存档

2009年(1)

2008年(4)

2007年(2)

我的朋友
最近访客

分类:

2008-11-14 00:14:49

完成了一个temp版本的URL类,很简单,就是分析URL,按RFC文档的格式分解出scheme, username, password, host, port, file directory, request, 简单地进行了一些合法性判断,这个URL类暂时解析的是HTTP, FTP, FILE三种协议的URL,没有使用xml进行配置的功能,但预留了interface,还进行了一些测试:

测试环境:VirtualBox 下 Federo Core 9
内核版本:2.6.25
编译环境:gcc 4.3.0
硬件环境:AMD 64 x2 4600+ 2.4GHz + 2G内存(公司电脑,其实很水)
测试数据:url 19337个
测试方法:读取文件,然后解析
测试结果:成功19217 失败120(不合法的URL)
real 0m0.137s
user 0m0.057s
sys 0m0.018s

对19337个URL进行了解析,总共用时0.1秒左右,当然这包括读文件的时间,我仔细进行了检查,失败的120个有一个URL是程序没有识别,这个URL形式是:

""

这种形式的URL很特别,URL嵌套URL,我的程序没有进行处理,我试着用浏览器运行了一下,发现浏览器把前面都截掉了,只留下了最后一个URL,但我感觉好像不是浏览器单方面截掉的,应该是服务器返回了类似重定向的处理。

还是要再看看RFC文档,去修改程序。

阅读(729) | 评论(0) | 转发(0) |
0

上一篇:Aranya之URL(1)

下一篇:Makefile学习

给主人留下些什么吧!~~