使用匹配URL的简单方法,提供测试代码。
在的官网上看到的parse_url()函数的替代方案。
结果和parse_url()函数差不多,是使用正则实现的。
URI 是 Web上可用的每种资源 - HTML文档、图像、视频片段、程序等 - 由一个通用资源标志符(Uniform Resource Identifier, 简称"URI")进行定位。 对象分组:
^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?
12 3 4
测试代码:
-
<?php
-
$search = '~^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?~i';
-
$url = '';
-
$url = trim($url);
-
preg_match_all($search, $url ,$rr);
-
printf("
输出URL数据为:
%s
\n",var_export( $rr ,TRUE));
-
/*
-
各分组如下
-
$1 = http:
-
$2 = http
-
$3 = //
-
$4 =
-
$5 = /pub/ietf/uri/
-
$6 =
-
$7 =
-
$8 = #Gonn
-
$9 = Gonn
-
*/
-
?>
上面的正则表达式可以获取URL中的任何一部分:
-
<?php
-
// 从 URL 中取得主机名
-
preg_match("/^(http:\/\/)?([^\/]+)/i", "http:///index.html", $matches);
-
$host = $matches[2];
-
// 从主机名中取得后面两段
-
preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);
-
echo "domain name is: {$matches[0]}\n";
-
?>
阅读(673) | 评论(0) | 转发(0) |