Chinaunix首页 | 论坛 | 博客
  • 博客访问: 104883
  • 博文数量: 49
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 10
  • 用 户 组: 普通用户
  • 注册时间: 2015-07-03 19:38
文章分类

全部博文(49)

文章存档

2016年(37)

2015年(12)

我的朋友

分类: LINUX

2016-01-25 21:46:35

摘要:
  本文介绍rename命令完成重命名批量文件语法,介绍了rename用到的Perl的替换和转化形式,并给出常用正规表达式。最后给出几个实例。

  偶尔会遇到需要重命名批量文件,最典型的例子就是数码相机的相片,在Ubuntu可以用工具Purrr或者PerfixSuffix实现该功能,但重命名批量文件并不常用,为了偶尔的一次操作,安装工具(可能通过Ubuntu Software Center或者sudo apt-get install安装),加之图形化界面操作也比较费时间。事实上,rename命令就可以出色完成该工作。
一、rename命令
  Linux的 rename 命令有两个版本(C语言和Perl语言),早期的Linux发行版基本上使用的是C语言版本,现在系统几乎都是Perl语言版本了(支持正则处理,功能更强大)[1]。可以通过命令man rename打开rename帮助文档查看版本,如果第一行内容如下,则是Perl语言版本。
  1. RENAME(1)     Perl Programmers Reference Guide              RENAME(1)
  鉴于Perl语言版本是主流,本文只介绍该版本下rename的用法,C语言版本操作见[1]。Perl语言版本的rename命令格式如下:
  1. rename [ -v ] [ -n ] [ -f ] perlexpr [ files ]
-v(verbose)打印被成功重命名的文件
-n(no-act)只是显示将被重命名的文件,而不重命名(重命名之前可以用-n确认
          需要重命名的文件)
-f(force)覆盖已经存在的文件
perlexprPerl语言格式的正则表达式
files需要被替换的文件(比如*.c、*.h),如果没给出文件名,将从标准输入读

  先举个例子来感受下,比如将当前目录下所有*.nc文件中Sam3替换成Stm32,命令如下:
  1. rename -n 's/Sam3/Stm32/' *.nc  /*确认需要重命名的文件*/
  2. rename -v 's/Sam3/Stm32/' *.nc  /*执行修改,并列出已重命名的文件*/
  整个命令的重点在于Perl语言正则表达式,下一部分将予以较详细的介绍。

二、Perl正则表达式
2.1 三种形式[2]
匹配:m//  (可以省略m,直接写成/regexp/)
替换:s//
转化:tr/// 
  博文[3]给出了8种模式,rename命令常用到替换和转化两种(用匹配也没意义)。转换跟替换不同,替换是将replacement整个字符串替换pattern字符串,而转换则是用replacement逐个字符替换pattern逐个字符,结果依赖于replacement与pattern字符个数(见下述分析)。
(1)替换
替换表达方式如下[3],还有一系列参数,貌似不怎么用得着。
  1. s/PATTERN/REPLACEMENT/egimosx
e Evaluate the right side as an expression.
g Match globally, i.e. all occurrences.
i Case-insensitive pattern matching.
m Treat string as multiple lines.
o Only compile pattern once, even if variables within it change.
s Treat string as single line.
x Use extended regular expressions
(2)转化
转化有两种等价表达方式,如下:
  1. tr/SEARCHLIST/REPLACEMENTLIST/cds
  2. y/SEARCHLIST/REPLACEMENTLIST/cds
c Complement the SEARCHLIST.
d Delete found but unreplaced characters.
s Squash duplicate replaced characters.
  转化同替换不同,用REPLACEMENTLIST逐个字符替换SEARCHLIST逐个字符,比如'tr/Sam/Stm/',用S替代S,t替代a,m替代m。结果依赖于两者字符长短,下面以文件名FastSpiSam3C.nc为例进行说明:
  1. jelline@jelline:~$ rename -n 'tr/Sam3/Stm/' FastSpiSam3C.nc /*替换字符短,用最后一个字符m替换3*/
  2. FastSpiSam3C.nc renamed as FtstSpiStmmC.nc

  3. jelline@jelline:~$ rename -n 'tr/Sam3/Stm32/' FastSpiSam3C.nc /*替换字符长,多出字符被忽略*/
  4. FastSpiSam3C.nc renamed as FtstSpiStm3C.nc
  参数c、d、s把我搞懵了,本想通过一系列操作,总结规律,结果徒劳。

2.2 常用模式
正则表达式中的一些常用模式pattern[2]:
x?  匹配 0 次或一次 x 字符串
x*  匹配 0 次或多次 x 字符串,但匹配可能的最少次数
x+  匹配 1 次或多次 x 字符串,但匹配可能的最少次数
.*  匹配 0 次或一次的任何字符
.+  匹配 1 次或多次的任何字符
{m} 匹配刚好是 m 个 的指定字符串
{m,n}匹配在 m个 以上 n个 以下 的指定字符串
{m,} 匹配 m个 以上 的指定字符串
[]  匹配符合 [] 内的字符
[^] 匹配不符合 [] 内的字符
[0-9]匹配所有数字字符
[a-z]匹配所有小写字母字符
[^0-9]匹配所有非数字字符
[^a-z]匹配所有非小写字母字符
^   匹配字符开头的字符
$   匹配字符结尾的字符
\d  匹配一个数字的字符,和 [0-9] 语法一样
\d+  匹配多个数字字符串,和 [0-9]+ 语法一样
\D  非数字,其他同 \d
\D+  非数字,其他同 \d+
\w   英文字母或数字的字符串,和 [a-zA-Z0-9] 语法一样
\w+  和 [a-zA-Z0-9]+ 语法一样
\W   非英文字母或数字的字符串,和 [^a-zA-Z0-9] 语法一样
\W+   和 [^a-zA-Z0-9]+ 语法一样
\s    空格,和 [\n\t\r\f] 语法一样
\s+   和 [\n\t\r\f]+ 一样
\S    非空格,和 [^\n\t\r\f] 语法一样
\S+   和 [^\n\t\r\f]+ 语法一样
\b    匹配以英文字母,数字为边界的字符串
\B    匹配不以英文字母,数值为边界的字符串
a|b|c 匹配符合a字符 或是b字符 或是c字符 的字符串
abc   匹配含有 abc 的字符串

三、实例
3.1 将所有*.nc文件中Sam3替换成Stm32
  1. rename -'s/Sam3/Stm32/' *.nc  /*执行修改,并列出已重命名的文件*/
3.2 去掉文件后缀名(比如去掉.bak)
  1. rename 's/\.bak$//' *.bak
3.3 将文件名改为小写
  1. rename 'y/A-Z/a-z/' *
3.4 去掉文件名的空格
  1. rename 's/[ ]+//g' *
3.5 文件开头加入字符串(比如jelline)
  1. rename 's/^/jelline/' *
3.6 文件末尾加入字符串(比如jelline)
  1. rename 's/$/jelline/' *


参考资料:
[2] 博文《
[3] 博文《
阅读(1254) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~