Chinaunix首页 | 论坛 | 博客
  • 博客访问: 8350716
  • 博文数量: 444
  • 博客积分: 10593
  • 博客等级: 上将
  • 技术积分: 3852
  • 用 户 组: 普通用户
  • 注册时间: 2006-05-09 15:26
文章分类

全部博文(444)

文章存档

2014年(1)

2013年(10)

2012年(18)

2011年(35)

2010年(125)

2009年(108)

2008年(52)

2007年(72)

2006年(23)

分类: 系统运维

2011-04-12 11:27:30

 

网页抓取实现机制(以查询特批号为例)

一、注册表增加IE邮件菜单

注册表文件内容:

Windows Registry Editor Version 5.00

 

[HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\MenuExt\校验特批号[z1] ]

@="http://[z2] /[z3] "

 

二、抓取数据中间页面

   Checktph.html 内容:

关键点在于[z8] document.all ('xxxx').value;

 

三、处理结果展示页面

     通过业务逻辑处理,将处理结果数据输出到展示页面,其内容为:

   

   

   

   

   

   

   

   

   

   

   

   

   

   

   

   

   

    

   

   

   

    

   


 [z1]菜单名称

 [z2]Web服务器

 [z3]抓取数据中间页面

 [z4]地址字段

 [z5]日期字段

 [z6]经办人字段

 [z7]通过window. openurl传参向业务逻辑传递相关参数。

 [z8]右键的父页面对象,网上有很多例子。

源文件

阅读(880) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~
特批号校验结果
查不到相关的特批号!
特批号存在

      ,但其他信息不正确!

特批号名:  property="name" />
特批号起期:  property="start" />
特批号止期:  property="end" />

         错误信息:  property="date" />不在有效期内。

         错误信息:部门不匹配。

         错误信息:特批号不是有效状态。