调用浏览器来抓取页面-rockylinux-ChinaUnix博客

rockylinux的ChinaUnix博客

首页　| 　博文目录　| 　关于我

rockylinux

博客访问： 1327138
博文数量： 115
博客积分： 10011
博客等级：上将
技术积分： 5785
用户组：普通用户
注册时间： 2006-03-28 09:13

文章分类

全部博文（115）

文章存档

2009年（23）

2008年（92）

我的朋友

相关博文

调用浏览器来抓取页面

分类： Java

2008-11-18 12:55:31

前面讲了两种抓取页面的方式，对于页面来说，都需要首先进行一定的分析，然后才能得到相应的结果，现在使用一种快捷的方式，直接进行分析。就是调用浏览器进行分析。使用浏览器，就和我们真实得操作上一样的，只不过是用程序自己去点击，这个思路来源于对网站的测试，实际上使用的也是测试的方法。使用Java的第三方类库Watij，比较方法，给出一个官方的简单例子，根据这个例子去扩展就OK了。

import watij.runtime.ie.IE; import junit.framework.TestCase; import static watij.finders.SymbolFactory.*; public class GoogleTest extends TestCase { public void testGoogleSearch() throws Exception { IE ie = new IE(); ie.start(""); ie.textField(name,"q").set("XWiki"); ie.button("Google Search").click(); assertTrue(ie.containsText("/Java wiki engine/")); } }

阅读(800) | 评论(0) | 转发(0) |

上一篇：使用HttpClient取页面

下一篇：神奇的Python

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6