分类: 系统运维
2008-03-01 09:28:32
一个基于一定规则的实时重写URL请求的引擎 | |
扩展(E) | |
rewrite_module | |
mod_rewrite.c | |
仅在 Apache 1.3 及以后的版本中可用 |
此模块提供了一个基于正则表达式分析器的重写引擎来实时重写URL请求。它支持每个完整规则可以拥有不限数量的子规则以及附加条件规则的灵活而且强大的URL操作机制。此URL操作可以依赖于各种测试,比如服务器变量、环境变量、HTTP头、时间标记,甚至各种格式的用于匹配URL组成部分的查找数据库。
此模块可以操作URL的所有部分(包括路径信息部分),在服务器级的(httpd.conf
)和目录级的(.htaccess
)配置都有效,还可以生成最终请求字符串。此重写操作的结果可以是内部子处理,也可以是外部请求的转向,甚至还可以是内部代理处理。
但是,所有这些功能和灵活性带来一个问题,那就是复杂性,因此,不要指望一天之内就能看懂整个模块。
更多的讨论、细节、示例,请查看详细的。
在Apache 1.3.20中,TestString和Substitution中的特殊字符可以用前导斜杠(\)来实现转义(即忽略其特殊含义而视之为普通字符)。 比如,Substitution可以用"\$
"来包含一个美元符号,以避免mod_rewrite把它视为反向引用。
此模块会跟踪两个额外的(非标准)CGI/SSI环境变量,SCRIPT_URL
和SCRIPT_URI
。他们包含了当前资源的逻辑网络视图,而标准CGI/SSI变量SCRIPT_NAME
和SCRIPT_FILENAME
包含的是物理系统视图。
注意:这些变量保持的是其最初被请求时的URI/URL,即在任何重写操作之前的URI/URL。其重要性在于他们是重写操作重写URL到物理路径名的原始依据。
SCRIPT_NAME=/sw/lib/w3s/tree/global/u/rse/.www/index.html SCRIPT_FILENAME=/u/rse/.www/index.html SCRIPT_URL=/u/rse/ SCRIPT_URI=
我们提供了和文档,列举了许多基于URL的问题的实用方案,其中你可以找到真实有用的规则集。
设置目录级重写的基准URL | |
RewriteBase URL-path | |
参见使用方法 | |
directory, .htaccess | |
FileInfo | |
扩展(E) | |
mod_rewrite |
RewriteBase
指令显式地设置了目录级重写的基准URL。在下文中,你将看到可以用于目录级的配置文件中(
.htaccess
)并在局部范围内起作用,即规则实际处理的只是剥离了本地路径前缀的一部分。处理结束后,这个路径会被自动地附着回去。默认值是"RewriteBase
physical-directory-path"。
在对一个新的URL进行替换时,此模块必须把这个URL重新注入到服务器处理中。为此,它必须知道其对应的URL前缀或者说URL基准。通常,此前缀就是对应的文件路径。但是,大多数网站URL不是直接对应于其物理文件路径的,因而一般不能做这样的假定! 所以在这种情况下,就必须用RewriteBase
指令来指定正确的URL前缀。
RewriteBase
指令,则必须在每个对应的.htaccess
文件中指定
。例如,目录级配置文件内容如下:
# /abc/def/.htaccess -- /abc/def 目录的配置文件 # 注意:/abc/def 是 /xyz 的物理路径(例如存在一条'Alias /xyz /abc/def'指令)。 RewriteEngine On # 让服务器知道我们使用的是 /xyz 而不是物理路径 /abc/def RewriteBase /xyz # 重写规则 RewriteRule ^oldstuff\.html$ newstuff.html
上述例子中,对/xyz/oldstuff.html
的请求被正确地重写为对物理文件/abc/def/newstuff.html
的请求。
以下列出了内部处理的详细步骤:
请求: /xyz/oldstuff.html 内部处理过程: /xyz/oldstuff.html -> /abc/def/oldstuff.html (per-server Alias) /abc/def/oldstuff.html -> /abc/def/newstuff.html (per-dir RewriteRule) /abc/def/newstuff.html -> /xyz/newstuff.html (per-dir RewriteBase) /xyz/newstuff.html -> /abc/def/newstuff.html (per-server Alias) 结果: /abc/def/newstuff.html
虽然这个过程看来很繁复,但是由于目录级重写的到来时机已经太晚了,它不得不把这个(重写)请求重新注入到Apache核心中,所以Apache内部确实是这样处理的。但是:它的开销并不象看起来的那样大,因为重新注入完全在Apache服务器内部进行,而且这样的过程在Apache内部也为其他许多操作所使用。所以,你可以充分信任其设计和实现是正确的。
定义重写发生的条件 | |
RewriteCond TestString CondPattern [flags] | |
server config, virtual host, directory, .htaccess | |
FileInfo | |
扩展(E) | |
mod_rewrite |
RewriteCond
指令定义了一个规则的条件,即在一个指令之前有一个或多个
RewriteCond
指令。条件之后的重写规则仅在当前URI与CondPattern匹配并且符合这些条件的时候才会起作用。
TestString是一个纯文本的字符串,但是还可以包含下列可扩展的成分:
$N
RewriteRule
指令的)RewriteCond
中的与Pattern匹配的分组成分(圆括号!)。
%N
RewriteCond
条件中最后符合的条件中的分组成分(圆括号!)。
${mapname:key|default}
%{
NAME_OF_VARIABLE}
HTTP头 | 连接与请求 | |
---|---|---|
HTTP_USER_AGENT HTTP_REFERER HTTP_COOKIE HTTP_FORWARDED HTTP_HOST HTTP_PROXY_CONNECTION HTTP_ACCEPT |
REMOTE_ADDR REMOTE_HOST REMOTE_PORT REMOTE_USER REMOTE_IDENT REQUEST_METHOD SCRIPT_FILENAME PATH_INFO QUERY_STRING AUTH_TYPE |
|
服务器自身 | 日期和时间 | 其它 |
DOCUMENT_ROOT SERVER_ADMIN SERVER_NAME SERVER_ADDR SERVER_PORT SERVER_PROTOCOL SERVER_SOFTWARE |
TIME_YEAR TIME_MON TIME_DAY TIME_HOUR TIME_MIN TIME_SEC TIME_WDAY TIME |
API_VERSION THE_REQUEST REQUEST_URI REQUEST_FILENAME IS_SUBREQ HTTPS |
这些变量都对应于类似命名的HTTP MIME头、Apache服务器的C变量、Unix系统中的struct tm
字段,其中的大多数在其他的手册或者CGI规范中都有说明。 其中为mod_rewrite所特有的变量如下:
IS_SUBREQ
API_VERSION
THE_REQUEST
GET /index.html HTTP/1.1
")。它不包含任何浏览器发送的其它头信息。
REQUEST_URI
REQUEST_FILENAME
HTTPS
是否已经加载,该变量都可以安全的使用)。 其它注意事项:
request_rec
结构中的filename
字段。 第一个就是大家都知道的CGI变量名,而第二个则是REQUEST_URI(request_rec
结构中的uri
字段)的一个副本。
%{ENV:variable}
,其中的variable可以是任意环境变量。它是通过查找Apache内部结构或者(如果没找到的话)由Apache服务器进程通过getenv()
得到的。
%{SSL:variable}
,其中的variable可以是一个的名字,无论
模块是否已经加载都可以使用(未加载时为空字符串)。比如:%{SSL:SSL_CIPHER_USEKEYSIZE}
将会被替换为128
。
%{HTTP:header}
,其中的header可以是任意HTTP MIME头的名称。它总是可以通过查找HTTP请求而得到。比如:%{HTTP:Proxy-Connection}
将被替换为Proxy-Connection:
HTTP头的值。
%{LA-U:variable}
,variable的最终值在执行一个内部(基于URL的)子请求后确定。 当需要使用一个目前未知但是会在之后的过程中设置的变量的时候,就可以使用这个方法。
例如,需要在服务器级配置(httpd.conf
文件)中根据REMOTE_USER
变量进行重写, 就必须使用%{LA-U:REMOTE_USER}
。因为此变量是由URL重写(mod_rewrite)步骤之后的认证步骤设置的。 但是另一方面,因为mod_rewrite是通过API修正步骤来实现目录级(.htaccess
文件)配置的, 而认证步骤先于API修正步骤,所以可以用%{REMOTE_USER}
。
%{LA-F:variable}
,variable的最终值在执行一个内部(基于文件名的)子请求后确定。 大多数情况下和上述的LA-U是相同的。 CondPattern是条件模式,即一个应用于当前TestString实例的正则表达式。TestString将被首先计算,然后再与CondPattern匹配。
注意:CondPattern是一个perl兼容的正则表达式,但是还有若干增补:
!
'(惊叹号)来指定不匹配。
""
(两个双引号),则TestString将与空字符串进行比较。
[flags]
作为RewriteCond
指令的第三个参数。flags是一个以逗号分隔的以下标记的列表:
nocase|NC
'(忽略大小写)ornext|OR
'(或下一条件)RewriteCond %{REMOTE_HOST} ^host1.* [OR] RewriteCond %{REMOTE_HOST} ^host2.* [OR] RewriteCond %{REMOTE_HOST} ^host3.* RewriteRule ... 针对这3个主机的规则集 ...
举例
如果要按请求头中的"User-Agent:
"重写一个站点的主页,可以这样写:
RewriteCond %{HTTP_USER_AGENT} ^Mozilla.* RewriteRule ^/$ /homepage.max.html [L] RewriteCond %{HTTP_USER_AGENT} ^Lynx.* RewriteRule ^/$ /homepage.min.html [L] RewriteRule ^/$ /homepage.std.html [L]
解释:如果你使用的浏览器识别标志是'Mozilla',则你将得到内容最大化的主页(含有Frames等等)。如果你使用的是(基于终端的)Lynx,则你得到的是内容最小化的主页(不含table等等)。如果上述条件都不满足(使用的是其他浏览器),则你得到的是一个标准的主页。
打开或关闭运行时的重写引擎 | |
RewriteEngine on|off | |
RewriteEngine off | |
server config, virtual host, directory, .htaccess | |
FileInfo | |
扩展(E) | |
mod_rewrite |
RewriteEngine
指令打开或关闭运行时的重写引擎。如果设置为off
,则此模块在运行时不执行任何重写操作, 同时也不更新SCRIPT_URx
环境变量。
使用该指令可以使此模块无效,而无须注释所有的指令!
注意:默认情况下,重写配置是不可继承的,也就是必须在每个需要使用重写引擎的虚拟主机中设置一个RewriteEngine on
指令。
设置 同步所使用的锁文件名 | |
RewriteLock file-path | |
server config | |
扩展(E) | |
mod_rewrite |
此指令设置mod_rewrite为了和程序通讯而使用的同步锁文件的名称。 在需要使用重写映射表程序(rewriting map-program)时,它必须是一个本地路径(而不能是一个NFS挂接设备)。对其他类型的重写映射表(rewriting map),则无此要求。
设置重写引擎日志的文件名 | |
RewriteLog file-path | |
server config, virtual host | |
扩展(E) | |
mod_rewrite |
RewriteLog
指令设置用于记录所有重写操作的日志文件的名称。如果此文件名不以斜杠('/
')开头,则它是相对于Server Root的,此指令应该在每个服务器级别的配置中仅仅出现一次。
/dev/null
,因为,虽然重写引擎不能输出记录了,但仍会在内部建立这个日志文件,这样会使服务器速度降低,而且对管理员毫无益处!要关闭日志,可以删除或注解RewriteLog
指令, 或者使用"RewriteLogLevel 0
"的设置RewriteLog "/usr/local/var/apache/logs/rewrite.log"
设置重写日志的详细程度 | |
RewriteLogLevel Level | |
RewriteLogLevel 0 | |
server config, virtual host | |
扩展(E) | |
mod_rewrite |
RewriteLogLevel
指令设置重写引擎日志的详细程度的级别。0(默认级别)意味着不记录,而9或更大的值意味着记录所有操作。
要关闭重写引擎日志,可以简单地将Level设为0,以关闭所有重写操作的记录。
RewriteLogLevel 3
定义用于关键词查找的映射函数 | |
RewriteMap MapName MapType:MapSource | |
server config, virtual host | |
扩展(E) | |
mod_rewrite | |
Apache 2.0.41 及以后的版本中可以使用不同的dbm类型 |
RewriteMap
指令定义了一个映射表(Rewriting Map),映射函数将使用该表来查找关键字然后插入/替换字段。此查找操作的源可以是多种类型。
是映射表的名称,指定了一个映射函数,用于重写规则的字符串替换,它可以是下列形式之一:
${
MapName:
LookupKey}
${
MapName:
LookupKey|
DefaultValue}
如果使用了这样的形式,则会在MapName中查找关键词LookupKey。如果找到了,则被替换成SubstValue; 如果没有找到,则被替换成DefaultValue,如果没有指定DefaultValue,则被替换成空字符串。
例如,你可能定义这样一个RewriteMap
:
RewriteMap examplemap txt:/path/to/file/map.txt
然后你就可以像下面这样在RewriteRule
中使用该映射:
RewriteRule ^/ex/(.*) ${examplemap:$1}
可以使用下列MapType和MapSource的组合:
txt
, MapSource: 有效的Unix文件系统文件名
这是重写映射表的标准形式。MapSource是一个纯文本文件,包含空行、注释行(以字符'#'打头),以及每行一个的替换对,如下所示:
MatchingKey SubstValue
## map.txt -- rewriting map Ralf.S.Engelschall rse # Bastard Operator From Hell Mr.Joe.Average joe # Mr. Average
RewriteMap real-to-user txt:/path/to/file/map.txt
rnd
, MapSource: 有效的Unix文件系统文件名
这个与上述的标准纯文本很相似,但它有一个特殊的后处理特性:查找完毕后,会解析其中包含的"|
"符号(含义为"或")。 也就是说,会随机地选择其中之一作为返回值。虽然这看似毫无意义,但设计它的意图是在一个查找值是服务器名称的反向代理环境中实现负载平衡。
例子
## map.txt -- rewriting map static www1|www2|www3|www4 dynamic www5|www6
RewriteMap servers rnd:/path/to/file/map.txt
RewriteRule ^/(.*\.(png|gif|jpg)) {servers:static}/$1 [NC,P,L]
RewriteRule ^/(.*) {servers:dynamic}/$1 [P,L]
dbm[=type]
, MapSource: 有效的Unix文件系统文件名
这里的源是一个二进制格式的DBM文件,包含了与纯文本相同的内容,但是因为它有优化了的特殊表现形式,使它的查找速度明显快得多。 此type可以是sdbm, gdbm, ndbm, db(由决定)。如果省略type,则使用编译时选择的缺省值。 你可以使用任何DBM工具或者下列Perl脚本来创建这个文件,但必须保证DBM的类型正确。建立NDBM文件的例子如下:
#!/path/to/bin/perl ## ## txt2dbm -- 将 txt 映射表转换为 dbm 格式 ## use NDBM_File; use Fcntl; ($txtmap, $dbmmap) = @ARGV; open(TXT, "<$txtmap") or die "Couldn't open $txtmap!\n"; tie (%DB, 'NDBM_File', $dbmmap,O_RDWR|O_TRUNC|O_CREAT, 0644) or die "Couldn't create $dbmmap!\n"; while () { next if (/^\s*#/ or /^\s*$/); $DB{$1} = $2 if (/^\s*(\S+)\s+(\S+)/); } untie %DB; close(TXT);
$ txt2dbm map.txt map.db
int
, MapSource: Apache内部函数
这里的源是一个Apache的内部函数。目前,还不能由你自己建立,只能使用下列已经存在的函数:
prg
, MapSource: 有效的Unix文件系统文件名
这里的源是一个程序,而不是一个映射表文件。程序设计语言可以随意选择,但最终结果必须是可执行的(或者是目标代码,或者是首行为'#!/path/to/interpreter
'的脚本)。
此程序仅在Apache服务器启动时启动一次,随后通过stdin
和stdout
文件句柄与重写引擎交互。 对每个映射函数的查找操作,它从stdin
接收以回车结束的查找关键词,然后把查找的结果以回车结束反馈到stdout
,如果查找失败,则返回四个字符的字符串"NULL"(对给定的关键词没有对应的值)。此程序的最简单形式是一个1:1的映射(即:key == value),例如:
#!/usr/bin/perl $| = 1; while () { # ...在这里放置转换和查找... print $_; }
但是必须注意:
stdout
做I/O缓冲(一个常见的错误),它会导致死循环!所以上述例子中才会使用"$|=1
"来预防。
指令定义一个锁文件,用于同步mod_rewrite和此程序之间的通讯。默认是没有同步操作的。 RewriteMap
指令可以多次出现。对每个映射函数都可以使用一个RewriteMap
指令来定义其重写映射表。虽然不能在目录上下文(per-directory context)中定义映射表,但是完全可以在其中使用映射表。
mtime
改变了或者服务器重启了。这样,你可以把每个请求都会用到的映射函数放在规则中,这是没有问题的,因为外部查找只进行一次。 为重写引擎设置一些特殊的选项 | |
RewriteOptions Options | |
server config, virtual host, directory, .htaccess | |
FileInfo | |
扩展(E) | |
mod_rewrite | |
MaxRedirects 在2.1及以后的版本中已经不可用 |
RewriteOptions
指令为当前服务器级和目录级的配置设置一些选项。Option当前仅可以是如下值:
inherit
.htaccess
中的条件和规则可以被继承。 为重写引擎定义重写规则 | |
RewriteRule Pattern Substitution [flags] | |
server config, virtual host, directory, .htaccess | |
FileInfo | |
扩展(E) | |
mod_rewrite | |
cookie-flag在Apache 2.0.40及以后的版本中可用 |
RewriteRule
指令是重写引擎的根本。此指令可以多次使用。每个指令定义一个简单的重写规则。这些规则的定义顺序尤为重要——在运行时,规则是按这个顺序逐一生效的。
是一个作用于当前URL的perl兼容的。"当前URL"是指该规则生效时刻的URL的值。它可能与被请求的URL截然不同,因为其他规则可能在此之前已经发生匹配并对它做了改动。
的一些用法示例:
文本.
任意一个单字符[
chars]
字符类: "chars"中的任意一个字符[^
chars]
字符类: 不在"chars"中的字符 text1|
text2 选择: text1 或 text2 量词?
前面的字符出现 0 或 1 次*
前面的字符出现 0 或 N 次(N > 0)+
前面的字符出现 1 或 N 次(N > 1) 分组(
text)
text 组 (常用于设置一个选择的边界,或用于生成后引用: 在RewriteRule中可以用$
N 引用第N个分组) 锚^
锚定到行首$
锚定到行尾 转义\
c 对给定的字符c进行转义 (比如对".[]()
"进行转义,等等)
更多有关正则表达式的资料请参见perl正则表达式手册页("")。另外,在mod_rewrite中,还可以使用否字符('!
')前缀实现反转。比如:"如果当前URL不与模式相匹配"它用于使用否定式匹配模式较容易描述的某些情况,或者作为最后一条规则。
$N
重写规则中的是当原始URL与Pattern相匹配时,用来替代(或替换)的字符串。除了纯文本,还可以包含:
$N
)
%N
)
%{VARNAME}
)中的服务器变量
${mapname:key|default}
) 反向引用的$
N(N=0..9)是指用Pattern匹配的第N组的内容去替换URL。服务器变量与RewriteCond
指令的TestString相同。映射函数由RewriteMap
指令决定,其说明也参见该指令。这三种类型变量按上面列表中的顺序被展开。
如上所述,所有的重写规则都是按配置文件中的定义顺序作用于Substitution的。URL被Substitution完全替换,并继续处理直到所有规则处理完毕,除非用L
标记显式地终结(见下文)。
'-
'是一个特殊的替换串,意思是不替换。它可以用于仅仅匹配某些URL而无须替换的情况,比如,在发生替换前,允许以C(chain)标记连接的多个匹配模式同时起作用。
此外,在Substitution之后还可以追加[
flags]
标记作为RewriteRule
指令的第三个参数。Flags是一个包含以逗号分隔的下列标记的列表:
chain|C
'(链接下一规则).www
"(此处不应该出现".www
")。
cookie|CO=
NAME:VAL:domain[:lifetime[:path]]'(设置cookie)env|E=
VAR:VAL'(设置环境变量)$N
和%N
)。此标记可以多次使用以设置多个变量。这些变量可以在其后许多情况下被间接引用,通常是在XSSI((none)
)或CGI($ENV{'VAR'}
)中,也可以在后继的RewriteCond
指令的CondPattern参数中通过%{ENV:VAR}
引用。使用它可以记住从URL中剥离的信息。
forbidden|F
'(强制禁止URL)gone|G
'(强制废弃URL)handler|H
=Content-handler'(强制指定内容处理器)
模块的
指令,以强制映射文件夹内的所有文件都由"cgi-script
"处理器处理。
last|L
'(结尾规则)last
命令或C语言中的break
命令。这个标记用于阻止当前已被重写的URL被后继规则再次重写。例如,使用它可以重写根路径的URL('/
')为实际存在的URL(比如:'/e/www/
')。
next|N
'(从头再来)next
命令或C语言中的continue
命令。此标记可以重新开始重写操作(立即回到循环的开头)。但是要小心,不要制造死循环!
nocase|NC
'(忽略大小写)noescape|NE
'(在输出中不对URI进行转义)RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE]
/foo/zed
转向到一个安全的请求'/bar?arg=P1=zed
'。
nosubreq|NS
'(不对内部子请求进行处理)
试图搜索目录默认文件(index.xxx
)时,Apache会在内部产生子请求。对于子请求,重写规则不一定有用,而且如果整个规则集都起作用,它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。proxy|P
'(强制为代理)http://
hostname开头),否则将得到一个代理模块返回的错误。使用这个标记,可以把某些远程成分映射到本地服务器域名空间,从而增强了指令的功能。
注意:要使用这个功能,必须已经启用了模块。
passthrough|PT
'(移交给下一个处理器)request_rec
结构中的uri
字段设置为filename
字段的值,这个小小的修改使得RewriteRule
指令的输出能够被(从URI转换到文件名的)Alias
, ScriptAlias
, Redirect
等指令进行后续处理[原文:This flag is just a hack to enable post-processing of the output of RewriteRule
directives, using Alias
, ScriptAlias
, Redirect
, and other directives from various URI-to-filename translators.]。举一个能说明其含义的例子: 如果要将/abc
重写为/def
, 然后再使用
将/def
转换为/ghi
,可以这样:
RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi
PT
标记,虽然将uri=/abc/...
重写为filename=/def/...
的部分运作正常,但是后续的mod_alias
在试图将URI转换到文件名时会遭遇失效。
注意:如果需要混合使用多个将URI转换到文件名的模块时,就必须使用这个标记。。此处混合使用和
就是个典型的例子。
qsappend|QSA
'(追加查询字符串)redirect|R
[=code]'(强制)[:thisport]/
(使新的URL成为一个URI)开头,可以强制性执行一个外部重定向。如果没有指定code,则产生一个HTTP响应码302(临时性移动)。如果需要使用在300-400范围内的其他响应代码,只需在此指定即可(或使用下列符号名称之一:temp
(默认), permanent
, seeother
)。使用它可以把规范化的URL反馈给客户端,如将"/~
"重写为"/u/
",或始终对/u/
user加上斜杠,等等。[:thisport]/
前缀,重写操作仍然会继续进行。通常,你还会希望停止重写操作而立即重定向,那么就还需要使用'L'标记。
skip|S
=num'(跳过后继规则)skip=N
个规则是else从句。注意:它和'chain|C'标记是不同的!
type|T
=MIME-type'(强制MIME类型).php
文件在以.phps
扩展名调用的情况下由mod_php
按照PHP源代码的MIME类型(application/x-httpd-php-source)显示:
RewriteRule ^(.+\.php)s$ $1 [T=application/x-httpd-php-source]
为了在文件中针对特定目录使用重写引擎,你必须同时设置"RewriteEngine On
"和"Options FollowSymLinks
"。如果管理员禁止了该目录的FollowSymLinks
特性,重写引擎将不会工作,这样做的原因是处于安全方面的考虑。
在服务器级配置中,模式匹配是作用于整个URL的。但是在目录级配置文件.htaccess
中使用重写引擎的时候,目录前缀(一般总是和特定的目录名称相同)将会在模式匹配前被自动移除并在替换完成后被自动添加回去。这个特性对于重写来说是非常重要的,否则你就被迫必须总是对父目录进行匹配,而这并不总是可行的。这里有一个例外:如果替换字符串以"http://
"开头,则不会添加目录前缀,而是强制执行一个外部重定向或代理操作(如果使用了P标志的话)。参见指令以获得更多信息。
还可以在配置段中使用重写引擎,前缀匹配规则与在
.htaccess
中使用重写引擎时完全相同,并且这种做法更加简单。然而,为了避免前缀替换复杂化,我们还是建议尽量将重写规则放置在主服务器或虚拟主机配置部分,而不是放置在配置段中。
虽然重写规则在语法上允许放置在配置段中,但这不是必须的,并且我们也反对这样做。
当替换字段以"[:thisport]
"作为前缀时,会将它自动剥离出去。在配合生成主机名部分的映射函数使用的时候,这个对隐含的外部重定向URL的简化操作是有用的而且是重要的。下面的第一个例子有助于理解这点。
谨记:由于此功能的存在,以""为前缀的无条件外部重定向到自身所在的服务器是无效的。要实现一个到自身的重定向,必须使用R标记。
Pattern不会按照查询字符串进行匹配。为了达到这个目的,你必须使用一个带有%{QUERY_STRING}
变量的指令。当然,你也可以在替换字符串中创建包含查询字符串的URL:在替换字符串串中使用问号,以标明其后的部分应该被重新注入到QUERY_STRING中。而要删除一个已有的请求串,则可以用问号来终结替换字符串。为了联合新旧查询字符串,请使用
[QSA]
标志。
以下是所有可能的替换组合及其含义:
在服务器级配置中(httpd.conf
)
对给定的请求"GET /somepath/pathinfo
":
给定的规则 得到的替换字符串 ---------------------------------------------- ---------------------------------- ^/somepath(.*) otherpath$1 非法,不被支持 ^/somepath(.*) otherpath$1 [R] 非法,不被支持 ^/somepath(.*) otherpath$1 [P] 非法,不被支持 ---------------------------------------------- ---------------------------------- ^/somepath(.*) /otherpath$1 /otherpath/pathinfo ^/somepath(.*) /otherpath$1 [R] /otherpath/pathinfo 通过外部重定向 ^/somepath(.*) /otherpath$1 [P] 毫无意义,不被支持 ---------------------------------------------- ---------------------------------- ^/somepath(.*) /otherpath$1 /otherpath/pathinfo ^/somepath(.*) /otherpath$1 [R] /otherpath/pathinfo 通过外部重定向 ^/somepath(.*) /otherpath$1 [P] 毫无意义,不被支持 ---------------------------------------------- ---------------------------------- ^/somepath(.*) 通过外部重定向 ^/somepath(.*) [R] 通过外部重定向 ([R]标记是多余的) ^/somepath(.*) [P] 通过内部代理
在/somepath
的目录级配置中
(也就是/physical/path/to/somepath/.htacccess
文件中含有:RewriteBase /somepath
)
对给定的请求"GET /somepath/localpath/pathinfo
":
给定的规则 得到的替换字符串 ---------------------------------------------- ---------------------------------- ^localpath(.*) otherpath$1 /somepath/otherpath/pathinfo ^localpath(.*) otherpath$1 [R] /somepath/otherpath/pathinfo 通过外部重定向 ^localpath(.*) otherpath$1 [P] 毫无意义,不被支持 ---------------------------------------------- ---------------------------------- ^localpath(.*) /otherpath$1 /otherpath/pathinfo ^localpath(.*) /otherpath$1 [R] /otherpath/pathinfo 通过外部重定向 ^localpath(.*) /otherpath$1 [P] 毫无意义,不被支持 ---------------------------------------------- ---------------------------------- ^localpath(.*) /otherpath$1 /otherpath/pathinfo ^localpath(.*) /otherpath$1 [R] /otherpath/pathinfo 通过外部重定向 ^localpath(.*) /otherpath$1 [P] 毫无意义,不被支持 ---------------------------------------------- ---------------------------------- ^localpath(.*) 通过外部重定向 ^localpath(.*) [R] 通过外部重定向 ([R]标记是多余的) ^localpath(.*) [P] 通过内部代理