======================== diff是生成源码补丁的必备工具 ========================
命令格式为:
-------------------------------------------------------
diff [命令行选项] 原始文件 新文件
常用命令行选项如下:
-r 递归处理目录
-u 输出统一格式(unified format)
-N patch里包含新文件
-a patch里可以包含二进制文件
它的输出在stdout上,所以你可能需要把它重定向到一个文件。diff的输出有“传统格式”和“统一格式”之分,现在大都使用统一格式:
传统格式示例:
# diff a.txt b.txt
2c2,3
< zengxiaolong
---
> zengzhaonong
> hello
统一格式示例:
# diff -u a.txt b.txt
--- a.txt 2007-01-25 11:03:30.000000000 +0800
+++ b.txt 2007-01-25 11:14:20.000000000 +0800
@@ -1,2 +1,3 @@
-zengxiaolong
+zengzhaonong
+hello
通过比较可以看出,传统格式的patch文件比较小,除了要删除/插入的行外没有冗余信息。统一格式则保存了上下文(缺省是上下各三行,最少需要两行), 这样,patch的时候可以允许行号不精确匹配的情况出现。另外,在patch文件的开头明确地用---和+++标示出原始文件和当前文件,也方便阅读。 要选用统一格式,用 u 开关。
使用diff生成patch:
-------------------------------------------------------
通常,我们需要对整个软件包做修改,并生成一个patch文件,下面是典型的操作过程。这里就要用到前面介绍的几个命令行开关了:
# tar xzvf software.tar.gz # 展开原始软件包,为目录software
# cp _a software software-orig # 做个修改前的备份
# cd software
[修改、 测试......]
# cd ..
# diff -ruNa software-orig software > software-my.patch
现在我们就可以保存software- my.patch做为这次修改的结果,至于新修改的软件包,可以不必保存。等到下次需要再修改的时候,可以用patch命令把这个补丁打进原始包,在上次 修改的基础上继续修改。比如是在linux kernel 上做的工作,就不必每次保存几十兆修改后的源码了。这是好处之一,好处之二是维护方便,由于unified patch格式有一定的模糊匹配能力,能减少原软件包升级带来的维护工作量。
======================== patch使用方法 ========================
patch -p参数 < 补丁文件(相对路径,绝对路径皆可)
说明:
(1) ”-p参数“由patch命令的执行目录(工作目录)和补丁头共同决定(补丁头是不变的,其实就是由patch命令的执行目录--当前目录决定)。
参数-p来指定从第几层开始搜索目标文件(寻找被打补丁的目标文件)。比如有一个patch文件的补丁头是这样的:
--- oldfile_path
+++ local/squid/need_patched_file
如果使用参数-p0,就表示从当前目录,找一个叫作local的目录,在它下面找一个叫squid的目录,再在它下面找一个叫need_patched_file的文件(目标文件就这样通过“-p参数”找到了)
如果使用参数-p1,就表示忽略第一层,从当前目录找一个叫squid的目录,在它下面找一个叫need_patched_file的文件。这样会忽略掉补丁头提到的local目录。
如果使用参数-p2,依此类推。
(2) 打补丁时首先打开补丁文件,根据补丁头和当前工作目录确定"-p参数",一般情况下,如果当前目录有需要打补丁的软件包(该软件包的顶极目录),则使用“-p0”即可
(3) 如果patch成功,缺省是不建备份文件的(注:FreeBSD下的patch工具缺省是保存备份),如果你需要,可以加上 b 开关。这样把修改前的文件以“原文件名.orig”的名字做备份。如果你喜欢其它后缀名,也可以用“b 后缀”来指定。
(4) 关于二进制文件的说明:binary文件可以原始方式存入patch文件。diff可以生成(加-a选项),patch也可以识别。如果觉得这样的patch文件太难看,解决方法之一是用uuencode处理该binary文件。
diff和patch是一对工具,在数学上来说,diff是对两个集合的差运算,patch是对两个集合的和运算。
diff比较两个文件或文件集合的差异,并记录下来,生成一个diff文件,这也是我们常说的patch文件,即补丁文件。
patch能将diff文件运用于 原来的两个集合之一,从而得到另一个集合。举个例子来说文件A和文件B,经过diff之后生成了补丁文件C,那么着个过程相当于 A -B = C ,那么patch的过程就是B+C = A 或A-C =B。
因此我们只要能得到A, B, C三个文件中的任何两个,就能用diff和patch这对工具生成另外一个文件。
这就是diff和patch的妙处。下面分别介绍一下两个工具的用法:
1. diff的用法
diff后面可以接两个文件名或两个目录名。 如果是一个目录名加一个文件名,那么只作用在那么个目录下的同名文件。
如果是两个目录的话,作用于该目录下的所有文件,不递归。如果我们希望递归执行,需要使用-r参数。
命令diff A B >C ,一般A是原始文件,B是修改后的文件,C称为A的补丁文件。
不加任何参数生成的diff文件格式是一种简单的格式,这种格式只标出了不一样的行数和内容。我们需要一种更详细的格式,可以标识出不同之处的上下文环境,这样更有利于提高patch命令的识别能力。这个时候可以用-c开关。
2. patch的用法
patch用于根据原文件和补丁文件生成目标文件。还是拿上个例子来说
patch A C 就能得到B, 这一步叫做对A打上了B的名字为C的补丁。
之一步之后,你的文件A就变成了文件B。如果你打完补丁之后想恢复到A怎么办呢?
patch -R B C 就可以重新还原到A了。
所以不用担心会失去A的问题。
其实patch在具体使用的时候是不用指定原文件的,因为补丁文件中都已经记载了原文件的路径和名称。patch足够聪明可以认出来。但是有时候会有点小问题。比如一般对两个目录diff的时候可能已经包含了原目录的名字,但是我们打补丁的时候会进入到目录中再使用patch,着个时候就需要你告诉 patch命令怎么处理补丁文件中的路径。可以利用-pn开关,告诉patch命令忽略的路径分隔符的个数。举例如下:
A文件在 DIR_A下,修改后的B文件在DIR_B下,一般DIR_A和DIR_B在同一级目录。我们为了对整个目录下的所有文件一次性diff,我们一般会到DIR_A和DIR_B的父目录下执行以下命令
diff -rc DIR_A DIR_B >C
这个时候补丁文件C中会记录了原始文件的路径为 DIR_A/A
现在另一个用户得到了A文件和C文件,其中A文件所在的目录也是DIR_A。 一般,他会比较喜欢在DIR_A目录下面进行patch操作,它会执行
patch
但是这个时候patch分析C文件中的记录,认为原始文件是./DIR_A/A,但实际上是./A,此时patch会找不到原始文件。为了避免这种情况我们可以使用-p1参数如下
patch -p1
此时,patch会忽略掉第1个”/”之前的内容,认为原始文件是 ./A,这样就正确了。
最后有以下几点注意:
1. 一次打多个patch的话,一般这些patch有先后顺序,得按次序打才行。
2. 在patch之前不要对原文件进行任何修改
3. 如果patch中记录的原始文件和你得到的原始文件版本不匹配(很容易出现),那么你可以尝试使用patch, 如果幸运的话,可以成功。大部分情况下,会有不匹配的情况,此时patch会生成rej文件,记录失败的地方,你可以手工修改。