Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1327138
  • 博文数量: 115
  • 博客积分: 10011
  • 博客等级: 上将
  • 技术积分: 5785
  • 用 户 组: 普通用户
  • 注册时间: 2006-03-28 09:13
文章分类
文章存档

2009年(23)

2008年(92)

我的朋友

分类: Java

2008-11-18 12:55:31

前面讲了两种抓取页面的方式,对于页面来说,都需要首先进行一定的分析,然后才能得到相应的结果,现在使用一种快捷的方式,直接进行分析。就是调用浏览器进行分析。使用浏览器,就和我们真实得操作上一样的,只不过是用程序自己去点击,这个思路来源于对网站的测试,实际上使用的也是测试的方法。使用Java的第三方类库Watij,比较方法,给出一个官方的简单例子,根据这个例子去扩展就OK了。

import watij.runtime.ie.IE;
import junit.framework.TestCase;
import static watij.finders.SymbolFactory.*;
 
public class GoogleTest extends TestCase {
    public void testGoogleSearch() throws Exception {
        IE ie = new IE();
        ie.start("");
        ie.textField(name,"q").set("XWiki");
        ie.button("Google Search").click();
        assertTrue(ie.containsText("/Java wiki engine/"));
    }
}

阅读(800) | 评论(0) | 转发(0) |
0

上一篇:使用HttpClient取页面

下一篇:神奇的Python

给主人留下些什么吧!~~