Chinaunix首页 | 论坛 | 博客
  • 博客访问: 162770
  • 博文数量: 89
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 70
  • 用 户 组: 普通用户
  • 注册时间: 2016-06-29 23:10
文章分类

全部博文(89)

文章存档

2016年(89)

我的朋友

分类: Web开发

2016-06-02 22:17:32

get方式获取网页中的链接

var http = require('http');

//定义函数
var getAHref = function(htmlstr){
    var reg = /)/gim;
    var arr = [];
    while(tem=reg.exec(htmlstr)){
        arr.push(tem[2]);
    }
    return arr;
}


var qHref = "设置被查询的目标网址
    var req = http.get(qHref, function(res) {
    var pageData = "";
    res.setEncoding('utf8');
    res.on('error', function (errget) {
           //出错处理
    });
    res.on('data', function (chunk) {
           pageData += chunk;
    });

    res.on('end', function(){
          //console.dir(pageData);
          var content = pageData;//获取到网页内容
          var hrefs=getAHref(content);//获取链接

    });

});

转载自:

阅读(781) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~