分类: LINUX
2008-09-03 09:51:52
二.Linux文件查找命令find,xargs详述
1.find 由于f i n d具有强大的功能,所以它的选项也很多,其中大部分选项都值得我们花时间来了解一下。即使系统中含有网络文件系统( N F S ),f i n d命令在该文件系统中同样有效,只你具有相应的权限。 在运行一个非常消耗资源的f i n d命令时,很多人都倾向于把它放在后台执行,因为遍历一个大的文件系统可能会花费很长的时间(这里是指3 0 G字节以上的文件系统)。 F i n d命令的一般形式为: 代码: find pathname -options [-print -exec -ok ...] 代码: pathname: find命令所查找的目录路径。例如用.来表示当前目录,用/来表示系统根目录。 -print: find命令将匹配的文件输出到标准输出。 -exec: find命令对匹配的文件执行该参数所给出的s h e l l命令。相应命令的形式为' command' {} \;,注意{ }和\;之间的空格。 -ok: 和- e x e c的作用相同,只不过以一种更为安全的模式来执行该参数所给出的s h e l l命令,在执行每一个命令之前,都会给出提示,让用户来确定是否执行。 代码: -name:按照文件名查找文件。 -perm:按照文件权限来查找文件。 -prune:使用这一选项可以使f i n d命令不在当前指定的目录中查找,如果同时使用-depth选项,那么-prune将被f i n d命令忽略。 -user: 按照文件属主来查找文件。 -group:按照文件所属的组来查找文件。 -mtime -n +n:按照文件的更改时间来查找文件, - n表示文件更改时间距现在n天以内,+ n表示文件更改时间距现在n天以前。F i n d命令还有- a t i m e和- c t i m e选项,但它们都和- m t i m e选项。 -nogroup:查找无有效所属组的文件,即该文件所属的组在/ e t c / g r o u p s中不存在。 -nouser:查找无有效属主的文件,即该文件的属主在/ e t c / p a s s w d中不存在。 -newer file1 ! file2:查找更改时间比文件f i l e 1新但比文件f i l e 2旧的文件。 -type 查找某一类型的文件,诸如: b - 块设备文件。 d - 目录。 c - 字符设备文件。 p - 管道文件。 l - 符号链接文件。 f - 普通文件。 -size n:[c] 查找文件长度为n块的文件,带有c时表示文件长度以字节计。 -depth:在查找文件时,首先查找当前目录中的文件,然后再在其子目录中查找。 -fstype:查找位于某一类型文件系统中的文件,这些文件系统类型通常可以在配置文件/ e t c / f s t a b中找到,该配置文件中包含了本系统中有关文件系统的信息。 -mount:在查找文件时不跨越文件系统m o u n t点。 -follow:如果f i n d命令遇到符号链接文件,就跟踪至链接所指向的文件。 -cpio:对匹配的文件使用c p i o命令,将这些文件备份到磁带设备中。 代码: -amin n 查找系统中最后N分钟访问的文件 -atime n 查找系统中最后n*24小时访问的文件 -cmin n 查找系统中最后N分钟被改变文件状态的文件 -ctime n 查找系统中最后n*24小时被改变文件状态的文件 -mmin n 查找系统中最后N分钟被改变文件数据的文件 -mtime n 查找系统中最后n*24小时被改变文件数据的文件 使用find时,只要把想要的操作写在一个文件里,就可以用exec来配合find查找,很方便的 (在有些操作系统中只允许- e x e c选项执行诸如l s或ls -l这样的命令)。大多数用户使用这一选项是为了查找旧文件并删除它们。建议在真正执行r m命令删除文件之前,最好先用l s命令看一下,确认它们是所要删除的文件。 e x e c选项后面跟随着所要执行的命令或脚本,然后是一对儿{ },一个空格和一个\,最后是一个分号。 为了使用e x e c选项,必须要同时使用p r i n t选项。如果验证一下f i n d命令,会发现该命令只输出从当前路径起的相对路径及文件名。 例如:为了用ls -l命令列出所匹配到的文件,可以把ls -l命令放在f i n d命令的- e x e c选项中 代码: # find . -type f -exec ls -l {} \; -rw-r--r-- 1 root root 34928 2003-02-25 ./conf/httpd.conf -rw-r--r-- 1 root root 12959 2003-02-25 ./conf/magic -rw-r--r-- 1 root root 180 2003-02-25 ./conf.d/README 在/ l o g s目录中查找更改时间在5日以前的文件并删除它们: 代码: $ find logs -type f -mtime +5 -exec rm {} \; 在下面的例子中, f i n d命令在当前目录中查找所有文件名以. L O G结尾、更改时间在5日以上的文件,并删除它们,只不过在删除之前先给出提示。 代码: $ find . -name "*.conf" -mtime +5 -ok rm {} \; < rm ... ./conf/httpd.conf > ? n 任何形式的命令都可以在- e x e c选项中使用。 在下面的例子中我们使用g r e p命令。f i n d命令首先匹配所有文件名为“ passwd*”的文件,例如passwd、passwd.old、passwd.bak,然后执 行grep命令看看在这些文件中是否存在一个sam用户。 代码: # find /etc -name "passwd*" -exec grep "sam" {} \; sam:x:501:501::/usr/sam:/bin/bash find命令的例子 查找当前用户主目录下的所有文件,下面两种方法都可以使用: 代码: $ find $HOME -print $ find ~ -print 代码: $ find . -type f -perm 644 -exec ls -l {} \; 代码: $ find / -type f -size 0 -exec ls -l {} \; 代码: $ find /var/logs -type f -mtime +7 -ok rm {} \; 代码: $find . -group root -exec ls -l {} \; -rw-r--r-- 1 root root 595 10月 31 01:09 ./fie1 下面的find命令将删除当目录中访问时间在7日以来、含有数字后缀的admin.log文件。该命令只检查三位数字,所以相应文件的后缀不要超过999。 先建几个admin.log*的文件 ,才能使用下面这个命令 代码: $ find . -name "admin.log[0-9][0-9][0-9]" -atime -7 -ok rm {} \; < rm ... ./admin.log001 > ? n < rm ... ./admin.log002 > ? n < rm ... ./admin.log042 > ? n < rm ... ./admin.log942 > ? n 代码: $ find . -type d |sort 代码: $ find /dev/rmt -print 在 使用f i n d命令的- e x e c选项处理匹配到的文件时, f i n d命令将所有匹配到的文件一起传递给e x e c执行。但有些系统对能够传递给e x e c的命令长度有限制,这样在f i n d命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是x a rg s命令的用处所在,特别是与f i n d命令一起使用。 F i n d命令把匹配到的文件传递给x a rg s命令,而x a rg s命令每次只获取一部分文件而不是全部,不像- e x e c选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。 在有些系统中,使用- e x e c选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行;这样在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高; 而使用x a rg s命令则只有一个进程。另外,在使用x a rg s命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。 来看看x a rg s命令是如何同f i n d命令一起使用的,并给出一些例子。 下面的例子查找系统中的每一个普通文件,然后使用x a rg s命令来测试它们分别属于哪类文件 代码: #find . -type f -print | xargs file ./.kde/Autostart/Autorun.desktop: UTF-8 Unicode English text ./.kde/Autostart/.directory: ISO-8859 text\ ...... 代码: $ find / -name "core" -print | xargs echo "" >/tmp/core.log 代码: #find . -name "file*" -print | xargs echo "" > /temp/core.log # cat /temp/core.log ./file6 代码: # ls -l drwxrwxrwx 2 sam adm 4096 10月 30 20:14 file6 -rwxrwxrwx 2 sam adm 0 10月 31 01:01 http3.conf -rwxrwxrwx 2 sam adm 0 10月 31 01:01 httpd.conf # find . -perm -7 -print | xargs chmod o-w # ls -l drwxrwxr-x 2 sam adm 4096 10月 30 20:14 file6 -rwxrwxr-x 2 sam adm 0 10月 31 01:01 http3.conf -rwxrwxr-x 2 sam adm 0 10月 31 01:01 httpd.conf 代码: # find . -type f -print | xargs grep "hostname" ./httpd1.conf:# different IP addresses or hostnames and have them handled by the ./httpd1.conf:# VirtualHost: If you want to maintain multiple domains/hostnames on your 代码: # find . -name \* -type f -print | xargs grep "hostnames" ./httpd1.conf:# different IP addresses or hostnames and have them handled by the ./httpd1.conf:# VirtualHost: If you want to maintain multiple domains/hostnames on your 3.f i n d命令配合使用e x e c和x a rg s可以使用户对所匹配到的文件执行几乎所有的命令。 下面是find一些常用参数的例子,有用到的时候查查就行了,像上面前几个贴子,都用到了其中的的一些参数,也可以用man或查看论坛里其它贴子有find的命令手册 a.使用name选项 文件名选项是f i n d命令最常用的选项,要么单独使用该选项,要么和其他选项一起使用。 可以使用某种文件名模式来匹配文件,记住要用引号将文件名模式引起来。 不管当前路径是什么,如果想要在自己的根目录$ H O M E中查找文件名符合* . t x t的文件,使用~作为' p a t h n a m e参数,波浪号~代表了你的$ H O M E目录。 代码: $ find ~ -name "*.txt" -print 代码: $ find . -name "*.txt" -print 代码: $ find . -name "[A-Z]*" -print 代码: $ find /etc -name "host*" -print 代码: $ find ~ -name "*" -print 或find . -print 代码: $ find / -name "*" -print 代码: $find . -name "[a-z][a-z][0--9][0--9].txt" -print b.用perm选项 按照文件权限模式用- p e r m选项。 按文件权限模式来查找文件的话。最好使用八进制的权限表示法。 如在当前目录下查找文件权限位为7 5 5的文件,即文件属主可以读、写、执行,其他用户可以读、执行的文件,可以用: 代码: $ find . -perm 755 -print 代码: # ls -l -rwxrwxr-x 2 sam adm 0 10月 31 01:01 http3.conf -rw-rw-rw- 1 sam adm 34890 10月 31 00:57 httpd1.conf -rwxrwxr-x 2 sam adm 0 10月 31 01:01 httpd.conf drw-rw-rw- 2 gem group 4096 10月 26 19:48 sam -rw-rw-rw- 1 root root 2792 10月 31 20:19 temp # find . -perm 006 # find . -perm -006 ./sam ./httpd1.conf ./temp -perm +mode:文件许可部分符合mode -perm -mode: 文件许可完全符合mode c.忽略某个目录 如 果在查找文件时希望忽略某个目录,因为你知道那个目录中没有你所要查找的文件,那么可以使用- p r u n e选项来指出需要忽略的目录。在使用- p r u n e选项时要当心,因为如果你同时使用了- d e p t h选项,那么- p r u n e选项就会被f i n d命令忽略。 如果希望在/ a p p s目录下查找文件,但不希望在/ a p p s / b i n目录下查找,可以用: 代码: $ find /apps -path "/apps/bin" -prune -o -print 使用find查找文件的时候怎么避开某个文件目录 比如要在/usr/sam目录下查找不在dir1子目录之内的所有文件 代码: find /usr/sam -path "/usr/sam/dir1" -prune -o -print find [-path ..] [expression] 在路径列表的后面的是表达式 -path "/usr/sam" -prune -o -print 是 -path "/usr/sam" -a -prune -o -print 的简写表达式按顺序求值, -a 和 -o 都是短路求值,与 shell 的 && 和 || 类似如果 -path "/usr/sam" 为真,则求值 -prune , -prune 返回真,与逻辑表达式为真;否则不求值 -prune ,与逻辑表达式为假。如果 -path "/usr/sam" -a -prune 为假,则求值 -print ,-print 返回真,或逻辑表达式为真;否则不求值 -print,或逻辑表达式为真。 这个表达式组合特例可以用伪码写为 代码: if -path "/usr/sam" then -prune else 代码: find /usr/sam \( -path /usr/sam/dir1 -o -path /usr/sam/file1 \) -prune -o -print \ 表示引用,即指示 shell 不对后面的字符作特殊解释,而留给 find 命令去解释其意义。 查找某一确定文件,-name等选项加在-o 之后 代码: #find /usr/sam \(-path /usr/sam/dir1 -o -path /usr/sam/file1 \) -prune -o -name "temp" -print 按文件属主查找文件,如在$ H O M E目录中查找文件属主为sam的文件,可以用: 代码: $ find ~ -user sam -print 代码: $ find /etc -user uucp -print 例如,希望在/ h o m e目录下查找所有的这类文件,可以用: 代码: $ find /home -nouser -print 就像u s e r和n o u s e r选项一样,针对文件所属于的用户组, f i n d命令也具有同样的选项,为了在/ a p p s目录下查找属于gem用户组的文件,可以用: 代码: $ find /apps -group gem -print 代码: $ find / -nogroup-print 如果希望按照更改时间来查找文件,可以使用m t i m e,atime或ctime选项。如果系统突然没有可用空间了,很有可能某一个文件的长度在此期间增长迅速,这时就可以用m t i m e选项来查找这样的文件。 用减号-来限定更改时间在距今n日以内的文件,而用加号+来限定更改时间在距今n日以前的文件。 希望在系统根目录下查找更改时间在5日以内的文件,可以用: 代码: $ find / -mtime -5 -print 代码: $ find /var/adm -mtime +3 -print 如果希望查找更改时间比某个文件新但比另一个文件旧的所有文件,可以使用- n e w e r选项。它的一般形式为: 代码: newest_file_name ! oldest_file_name 查找更改时间比文件sam新但比文件temp旧的文件: 例:有两个文件 代码: -rw-r--r-- 1 sam adm 0 10月 31 01:07 fiel -rw-rw-rw- 1 sam adm 34890 10月 31 00:57 httpd1.conf -rwxrwxr-x 2 sam adm 0 10月 31 01:01 httpd.conf drw-rw-rw- 2 gem group 4096 10月 26 19:48 sam -rw-rw-rw- 1 root root 2792 10月 31 20:19 temp # find -newer httpd1.conf ! -newer temp -ls 1077669 0 -rwxrwxr-x 2 sam adm 0 10月 31 01:01 ./httpd.conf 1077671 4 -rw-rw-rw- 1 root root 2792 10月 31 20:19 ./temp 1077673 0 -rw-r--r-- 1 sam adm 0 10月 31 01:07 ./fiel 查找更改时间在比temp文件新的文件: 代码: $ find . -newer temp -print 在/ e t c目录下查找所有的目录,可以用: 代码: $ find /etc -type d -print 代码: $ find . ! -type d -print 代码: $ find /etc -type l -print 可以按照文件长度来查找文件,这里所指的文件长度既可以用块( b l o c k)来计量,也可以用字节来计量。以字节计量文件长度的表达形式为N c;以块计量文件长度只用数字表示即可。 在按照文件长度查找文件时,一般使用这种以字节表示的文件长度,在查看文件系统的大小,因为这时使用块来计量更容易转换。 在当前目录下查找文件长度大于1 M字节的文件: 代码: $ find . -size +1000000c -print 代码: $ find /home/apache -size 100c -print 代码: $ find . -size +10 -print 在使用f i n d命令时,可能希望先匹配所有的文件,再在子目录中查找。使用d e p t h选项就可以使f i n d命令这样做。这样做的一个原因就是,当在使用f i n d命令向磁带上备份文件系统时,希望首先备份所有的文件,其次再备份子目录中的文件。 在下面的例子中, f i n d命令从文件系统的根目录开始,查找一个名为C O N . F I L E的文件。 它将首先匹配所有的文件然后再进入子目录中查找。 代码: $ find / -name "CON.FILE" -depth -print 在当前的文件系统中查找文件(不进入其他文件系统),可以使用f i n d命令的m o u n t选项。 从当前目录开始查找位于本文件系统中文件名以X C结尾的文件: 代码: $ find . -name "*.XC" -mount -print more [文件名] 分页显示一个文件或任何输出结果 其实more不是用来寻找文件的,但是一般人却十有八九是在找文件时把它派上用场。 因为 more 主要的作用是把输出结果显示在屏幕上,一页停止一次,所以例如当我们用 ls 命令去找一个 x字母开头的文件,而下达了 ls x* 却仍然列出太多文件,一个屏幕看不完时,就可以配合管道符号和 more 命令: ls x* | more 它会一屏停止一下,等待您按空白键才继续往上卷。于是 more 俨然犹如 DOS 的 DIR 命令 /P 选项的地位了。而 more 当主角的时候,是用做一页一次显示文章,例如我们想要看 /etc 里面的 XF86Config 文件,可以下如下命令: more /etc/XF86Config 这样,我们就可以不断按空白键把这个文件慢慢看完。但是,因为more 先天的设计,如果您看完了这页,想要回头看上一页,很抱歉,是不行的,您必须从头再来!于是大家在使用中就干脆摒弃这个命令,而代之以 vi 或者pico, joe等文书编辑器来看文字文件了! pico /etc/XF86Config 到最后,很少人再用more了。所以more经常配合 ls在找文件的场合出现,每天都可以上场十几次。 所以,相信把失去主要舞台的 more归类为找寻文件的相关命令虽不合法,但合情合理也合于现状。 练习: 请您用 more 去看一个文字文件,与用 pico 去看一个文字文件相比较,哪一个比较方便? less [文件名] 分页显示一个文件并且可以回头 less命令很好笑,取名时就故意与more 命令打对台,你叫“更多”,我就叫“更少”,就好像你叫黑人牙膏我就叫白人牙膏一样。事实上与什么“更多”、“更少”都没有关系。它最主要只是为了改进一点:more 不能回头看的问题! less 的优点就是可以随时回头,最简单的用【PgUp】键就可以向上翻。 可是依我们的孤陋之见,还是用文书编辑器去阅读文件就好了嘛,更何况 less 本身还有高达 42 个选项,何必那么麻烦! 所以,为了您好,选项我们也不介绍了。这个命令目前只在 Linux 系统可以使用,其他 UNIX 家族尚无。 练习: (1)请您用 less 去看一个文字文件,与用 pico 去看一个文字文件相比,哪一个比较方便? (2)less命令能像more命令一样配合管道符号,让ls的列示文件能够回头翻看吗? whereis 文件名 寻找文件工具 whereis 是一个小巧好用的文件寻找工具,它专门用来寻找可执行的程序、原始程序和使用手册。 例如执行命令: whereis bzip2 它就会告诉您,bzip2 放在 /usr/bin 。通常,如果您确定某个东西是程序,而用 whereis 找不到的话,那就表示本系统没有安装该程序了,例如: whereis cjoe 表示这套系统中没有装 cjoe,否则应该会找到才对。 练习: (1)找找您的系统上有没有xpaint这个程序?因为这个程序在 KDE 和 GNOME 的默认主菜单上都没有列出来,但并不表示一定没有。 (2)能用 whereis 命令去找到XF86Config设置文件在哪里吗?为什么? locate 文件名 寻找文件工具 locate 也是一个寻找文件的工具,但是它不像 whereis 只能找程序文件等几种文件,也不像find那么复杂,可以算是“中庸之道”! 中庸之道,往往就是大部分人最佳的选择。 whereis找不到的文件,find要一大串命令,还花了很久的时间才找到的XF86Config设置文件,而用locate一下子就简单找到了! 练习: (1)用 locate 找找有没有一个inittab文件? (2)用 locate 找找有哪些 .pcf 字形文件。如果找不到的话,找找看已经压缩过的字形文件 .pcf.Z 或者 .pcf.gz。 grep [-选项] [字串] [文件名] 寻找某字串内容工具 有些时候,我们存储文件时随手乱取了一个文件名,事后自己都忘了那个文件名叫什么,连开头第一个字母都想不起来。那么,如果您还记得该文件一点特殊的词语,应该可以用 grep 命令找到。 例如,我们想在一个目录的200个文件里面,找出哪一个文件提到“排版”这个词语: grep 排版 *.txt 找到了两个文件有此字样。然后您再自行调出看看到底哪一篇才是您所要的即可。寻找时注意尽量寻找特殊词语,如果您输入“然后”、“这样”、“不是”、“电脑”……这类太普遍的词语,可能几百篇文章中都有,那就失去了用 grep 找文件的意义了。 因为例子中第二篇文章出现了两次,所以列出了3行,其实只有两个文件符合。如果您想要让它凡是符合条件的只出现一次的话,加上 -l 选项就可以了. 其他常用的选项还有: -n 同时列出该词语出现在文章的第几行。 -c 计算一下该字串出现的次数。 -i 比对的时候,不计较大小写的不同。 练习: 当我们要为系统增加一个用户时,往往担心添加一个已经存在的用户名字。如果用 grep 命令,可不可以避免这个问题?如何避免? env 查看环境设置 env 命令可以设置很多环境变量,例如终端机的类型、使用的浏览器、用户主目录(Home Directory)的所在等等。 但是我们现在把焦点集中在其中一项:PATH环境变量。 因为 PATH 这个环境变量掌管了您下达命令的时候,它会到下面几个目录去找您命令的程序: /usr/bin /sbin /usr/sbin /usr/X11R6/bin /root/bin 那么您用 env 命令,让它把所有的环境变量列出来的时候,就可以看到有一行PATH 设置,把上述几个目录用分号分开,然后串成一串。这就是它所谓寻找命令的“路径”。DOS 系统也有一个同名而且意义非常相似的路径设置。 如果您想在它查找命令的路径上增加一个 /usr/bin/he,而把 /root/bin 去掉,那么您可以重新下达: env PATH=/usr/bin;/sbin;/usr/sbin;/usr/X11R6/bin;/usr/bin/he 当然env 其他的变量也可以这样改变。但是因为涉及面太广,我们就只把焦点集中在改变查找路径上,其他暂时不谈 |