Chinaunix首页 | 论坛 | 博客
  • 博客访问: 10724
  • 博文数量: 9
  • 博客积分: 30
  • 博客等级: 民兵
  • 技术积分: 95
  • 用 户 组: 普通用户
  • 注册时间: 2011-04-07 14:41
文章分类

全部博文(9)

文章存档

2013年(8)

2012年(1)

我的朋友

分类: Python/Ruby

2012-02-24 15:32:34

    针对目标网站,我们可以采用以下方式:
1.使用file()函数,获取目标页面文件流,转换成字符串,作进一步处理.
  一个范例函数:

CODE:

//获取目标页面文件流并转换成字符串形式
function openfile($url)
{
if(file($url)){
        $str = file($url);
        $count = count($str);
        for ($i=0;$i<$count;$i++){
        $file .= $str[$i];
                        
                                 }
        return $file;
              } else { die("文件打开失败!"); }
}
用法举例:
$getstr=openfile("");
//getsrt是一个字符串,你可对它作进一步处理。

2.使用file_get_contents()函数,该函数可以直接将获取的web页面内容转换成字符串

CODE:

$getstr=file_get_contents("");
//getsrt就是一个字符串,你可对它作进一步处理。

3.使用Microsoft.XMLHTTP组件方式。不过该组件需要windows平台支持,它是windows的一个组件,php程序以com形式调用它。
范例程序:

CODE:

//Microsoft.XMLHTTP组件使用范例程序get.php
//作者:天涯风云
$url=$_GET['id'];
$xmlhttp = new COM("Microsoft.XMLHTTP") or die("无法创建Microsoft.XMLHTTP组件!");
$xmlhttp->open("GET",$url,False, "", "");
$xmlhttp->setRequestHeader("content-Type","text/html");
$xmlhttp->send();
$body=$xmlhttp->responseText;
echo $body;
?>
用法:get.php?id="目标页面"

4.使用fsockopen()函数,获取文件流
范例程序:

CODE:

function request_url($url,$method='POST') {
$url = parse_url($url); //解析url地址,取得host,path,port,query等
if (!$url) return "couldn't parse url";
if (!isset($url['port'])) { $url['port'] = ""; }
if (!isset($url['query'])) { $url['query'] = ""; }
//连接服务器
$fp = fsockopen($url['host'], $url['port'] ? $url['port'] : 80);
if (!$fp) return "不能连接".$url['host']."服务器";
//发送请求
fputs($fp, sprintf("$method %s%s%s HTTP/1.0/n", $url['path'], $url['query'] ? "?" : "", $url['query']));
fputs($fp, "Host: $url[host]/n");
fputs($fp, "Content-type: application/x-www-form-urlencoded/n");
fputs($fp, "Connection: close/n/n");
//获得请求后返回的内容
$line = fgets($fp,1024);
if (!eregi("^HTTP/1/.. 200", $line)) return;
$results = "";
while(!feof($fp)) {
$line = fgets($fp,1024);
$results .= $line;
}
fclose($fp);
return $results;
}

函数用法:
$getstr=request_url("目标页面");
//getstr是一个字符串,你可对它作进一步处理。

come from http://blog.csdn.net/binger819623/article/details/3985592
阅读(371) | 评论(0) | 转发(0) |
0

上一篇:没有了

下一篇:身份证号码的编排规则

给主人留下些什么吧!~~