摘要:
本文介绍rename命令完成重命名批量文件语法,介绍了rename用到的Perl的替换和转化形式,并给出常用正规表达式。最后给出几个实例。
偶尔会遇到需要重命名批量文件,最典型的例子就是数码相机的相片,在Ubuntu可以用工具Purrr或者PerfixSuffix实现该功能,但重命名批量文件并不常用,为了偶尔的一次操作,安装工具(可能通过Ubuntu Software Center或者sudo apt-get install安装),加之图形化界面操作也比较费时间。事实上,rename命令就可以出色完成该工作。一、rename命令
Linux的 rename 命令有两个版本(C语言和Perl语言),早期的Linux发行版基本上使用的是C语言版本,现在系统几乎都是Perl语言版本了(支持正则处理,功能更强大)[1]。可以通过命令man rename打开rename帮助文档查看版本,如果第一行内容如下,则是Perl语言版本。
- RENAME(1) Perl Programmers Reference Guide RENAME(1)
鉴于Perl语言版本是主流,本文只介绍该版本下rename的用法,C语言版本操作见[1]。Perl语言版本的rename命令格式如下:
- rename [ -v ] [ -n ] [ -f ] perlexpr [ files ]
-n(no-act)只是显示将被重命名的文件,而不重命名(重命名之前可以用-n确认
需要重命名的文件)
files需要被替换的文件(比如*.c、*.h),如果没给出文件名,将从标准输入读
先举个例子来感受下,比如将当前目录下所有*.nc文件中Sam3替换成Stm32,命令如下:
- rename -n 's/Sam3/Stm32/' *.nc /*确认需要重命名的文件*/
-
rename -v 's/Sam3/Stm32/' *.nc /*执行修改,并列出已重命名的文件*/
整个命令的重点在于Perl语言正则表达式,下一部分将予以较详细的介绍。
二、Perl正则表达式
2.1 三种形式[2]
匹配:m// (可以省略m,直接写成/regexp/)
博文[3]给出了8种模式,rename命令常用到替换和转化两种(用匹配也没意义)。转换跟替换不同,替换是将replacement整个字符串替换pattern字符串,而转换则是用replacement逐个字符替换pattern逐个字符,结果依赖于replacement与pattern字符个数(见下述分析)。(1)替换
替换表达方式如下[3],还有一系列参数,貌似不怎么用得着。
- s/PATTERN/REPLACEMENT/egimosx
e Evaluate the right side as an expression.
g Match globally, i.e. all occurrences.
i Case-insensitive pattern matching.
m Treat string as multiple lines.
o Only compile pattern once, even if variables within it change.
s Treat string as single line.
x Use extended regular expressions
(2)转化
转化有两种等价表达方式,如下:
- tr/SEARCHLIST/REPLACEMENTLIST/cds
-
y/SEARCHLIST/REPLACEMENTLIST/cds
c Complement the SEARCHLIST.
d Delete found but unreplaced characters.
s Squash duplicate replaced characters.
转化同替换不同,用REPLACEMENTLIST逐个字符替换SEARCHLIST逐个字符,比如'tr/Sam/Stm/',用S替代S,t替代a,m替代m。结果依赖于两者字符长短,下面以文件名FastSpiSam3C.nc为例进行说明:
- jelline@jelline:~$ rename -n 'tr/Sam3/Stm/' FastSpiSam3C.nc /*替换字符短,用最后一个字符m替换3*/
-
FastSpiSam3C.nc renamed as FtstSpiStmmC.nc
-
-
jelline@jelline:~$ rename -n 'tr/Sam3/Stm32/' FastSpiSam3C.nc /*替换字符长,多出字符被忽略*/
-
FastSpiSam3C.nc renamed as FtstSpiStm3C.nc
参数c、d、s把我搞懵了,本想通过一系列操作,总结规律,结果徒劳。
2.2 常用模式
正则表达式中的一些常用模式pattern[2]:
x? 匹配 0 次或一次 x 字符串
x* 匹配 0 次或多次 x 字符串,但匹配可能的最少次数
x+ 匹配 1 次或多次 x 字符串,但匹配可能的最少次数
.* 匹配 0 次或一次的任何字符
.+ 匹配 1 次或多次的任何字符
{m} 匹配刚好是 m 个 的指定字符串
{m,n}匹配在 m个 以上 n个 以下 的指定字符串
{m,} 匹配 m个 以上 的指定字符串
[] 匹配符合 [] 内的字符
[^] 匹配不符合 [] 内的字符
[0-9]匹配所有数字字符
[a-z]匹配所有小写字母字符
[^0-9]匹配所有非数字字符
[^a-z]匹配所有非小写字母字符
^ 匹配字符开头的字符
$ 匹配字符结尾的字符
\d 匹配一个数字的字符,和 [0-9] 语法一样
\d+ 匹配多个数字字符串,和 [0-9]+ 语法一样
\D 非数字,其他同 \d
\D+ 非数字,其他同 \d+
\w 英文字母或数字的字符串,和 [a-zA-Z0-9] 语法一样
\w+ 和 [a-zA-Z0-9]+ 语法一样
\W 非英文字母或数字的字符串,和 [^a-zA-Z0-9] 语法一样
\W+ 和 [^a-zA-Z0-9]+ 语法一样
\s 空格,和 [\n\t\r\f] 语法一样
\s+ 和 [\n\t\r\f]+ 一样
\S 非空格,和 [^\n\t\r\f] 语法一样
\S+ 和 [^\n\t\r\f]+ 语法一样
\b 匹配以英文字母,数字为边界的字符串
\B 匹配不以英文字母,数值为边界的字符串
a|b|c 匹配符合a字符 或是b字符 或是c字符 的字符串
abc 匹配含有 abc 的字符串
三、实例
3.1 将所有*.nc文件中Sam3替换成Stm32
- rename -v 's/Sam3/Stm32/' *.nc /*执行修改,并列出已重命名的文件*/
3.2 去掉文件后缀名(比如去掉.bak)
- rename 's/\.bak$//' *.bak
3.3 将文件名改为小写
3.4 去掉文件名的空格
3.5 文件开头加入字符串(比如jelline)
3.6 文件末尾加入字符串(比如jelline)
参考资料:
[2] 博文《》
[3] 博文《》
阅读(8703) | 评论(1) | 转发(1) |