Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1636732
  • 博文数量: 584
  • 博客积分: 13857
  • 博客等级: 上将
  • 技术积分: 11883
  • 用 户 组: 普通用户
  • 注册时间: 2009-12-16 09:34

分类: LINUX

2010-01-06 15:09:38

摘自《高级bash脚本编程指南》

变量替换

处理和(或)扩展变量

${parameter}

与$parameter相同, 也就是变量parameter的值. 在某些上下文中, ${parameter}很少会产生混淆.

可以把变量和字符串组合起来使用.

      1 your_id=${USER}-on-${HOSTNAME}
2 echo "$your_id"
3 #
4 echo "Old \$PATH = $PATH"
5 PATH=${PATH}:/opt/bin #在脚本的生命周期中, /opt/bin会被添加到$PATH变量中.
6 echo "New \$PATH = $PATH"

${parameter-default}, ${parameter:-default}

${parameter-default} — 如果变量parameter没被声明, 那么就使用默认值.

${parameter:-default} — 如果变量parameter没被设置, 那么就使用默认值.
注:“(没)被声明”与“(没)被设置”在是否有 “:” 号的句式差别中仅仅是触发点的不同而已。“被声明”的触发点显然要比“被设置”的要低,“被设置”是在“被声明”的基础上而且不能赋值(设置)为空(没有赋值/设置为空)。

      1 echo ${username-`whoami`}
2 # 如果变量$username还没有被声明, 那么就echo出`whoami`的结果(译者注: 也就是把'whoami'的结果赋值给变量$username).

注:${parameter-default} 和${parameter:-default}在绝大多数的情况下都是相同的. 只有在parameter已经被声明, 但是被赋null值得时候, 这个额外的 : 才会产生不同的结果.

  1 #!/bin/bash
2 # param-sub.sh
3
4 # 一个变量是否被声明或设置,
5 #+ 将会影响这个变量是否使用默认值,
6 #+ 即使这个变量值为空(null).
7
8 username0=
9 echo "username0 has been declared, but is set to null."
10 echo "username0 = ${username0-`whoami`}"
11 # 不会有输出.
12
13 echo
14
15 echo username1 has not been declared.
16 echo "username1 = ${username1-`whoami`}"
17 # 将会输出默认值.
18
19 username2=
20 echo "username2 has been declared, but is set to null."
21 echo "username2 = ${username2:-`whoami`}"
22 # ^
23 # 会输出, 因为:-会比-多一个条件测试.
24 # 可以与上边的例子比较一下.
25
26
27 #
28
29 # 再来一个:
30
31 variable=
32 # 变量已经被声明, 但是设为空值.
33
34 echo "${variable-0}" # (没有输出)
35 echo "${variable:-1}" # 1
36 # ^
37
38 unset variable
39
40 echo "${variable-2}" # 2
41 echo "${variable:-3}" # 3
42
43 exit 0

如果脚本并没有接收到来自命令行的参数, 那么默认参数结构将会提供一个默认值给脚本.

  1 DEFAULT_FILENAME=generic.data
2 filename=${1:-$DEFAULT_FILENAME} #对 $1 设置默认值
3 # 如果没有指定值, 那么下面的代码块将会使用filename
4 #+ 变量的默认值"generic.data".
5 #
6 # 后续的命令.

${parameter=default}, ${parameter:=default}

${parameter=default} — 如果变量parameter没被声明, 那么就把它的值设为default.

${parameter:=default} — 如果变量parameter没被设置, 那么就把它的值设为default.

这两种形式基本上是一样的. 只有在变量$parameter被声明并且被设置为null值的时候, : 才会引起这两种形式的不同. 如上边所示.

      1 echo ${username=`whoami`}
2 # 变量"username"现在被赋值为`whoami`.

${parameter+alt_value}, ${parameter:+alt_value}

${parameter+alt_value} — 如果变量parameter被声明了, 那么就使用alt_value, 否则就使用null字符串.

${parameter:+alt_value} — 如果变量parameter被设置了, 那么就使用alt_value, 否则就使用null字符串.

这两种形式绝大多数情况下都一样. 只有在parameter被声明并且设置为null值的时候, 多出来的这个 : 才会引起这两种形式的不同, 具体请看下边的例子.

  1 echo "###### \${parameter+alt_value} ########"
2 echo
3
4 a=${param1+xyz}
5 echo "a = $a" # a =
6
7 param2=
8 a=${param2+xyz}
9 echo "a = $a" # a = xyz
10
11 param3=123
12 a=${param3+xyz}
13 echo "a = $a" # a = xyz
14
15 echo
16 echo "###### \${parameter:+alt_value} ########"
17 echo
18
19 a=${param4:+xyz}
20 echo "a = $a" # a =
21
22 param5=
23 a=${param5:+xyz}
24 echo "a = $a" # a =
25 # 产生与a=${param5+xyz}不同的结果.
26
27 param6=123
28 a=${param6:+xyz}
29 echo "a = $a" # a = xyz

${parameter?err_msg}, ${parameter:?err_msg}

${parameter?err_msg} — 如果parameter被声明了, 那么就使用设置的值, 否则打印err_msg错误消息.

${parameter:?err_msg} — 如果parameter被设置了, 那么就使用设置的值, 否则打印err_msg错误消息.

这两种形式绝大多数情况都是一样的. 和上边所讲的情况一样, 只有在parameter被声明并设置为null值的时候, 多出来的 : 才会引起这两种形式的不同.

例子 1. 使用参数替换和错误消息

  1 #!/bin/bash
2
3 # 检查一些系统环境变量.
4 # 这是一种可以做一些预防性保护措施的好习惯.
5 # 比如, 如果$USER(用户在控制台上中的名字)没有被设置的话,
6 #+ 那么系统就会不认你.
7
8 : ${HOSTNAME?} ${USER?} ${HOME?} ${MAIL?}
9 echo
10 echo "Name of the machine is $HOSTNAME."
11 echo "You are $USER."
12 echo "Your home directory is $HOME."
13 echo "Your mail INBOX is located in $MAIL."
14 echo
15 echo "If you are reading this message,"
16 echo "critical environmental variables have been set."
17 echo
18 echo
19
20 # ------------------------------------------------------
21
22 # ${variablename?}结构
23 #+ 也能够检查脚本中变量的设置情况.
24
25 ThisVariable=Value-of-ThisVariable
26 # 注意, 顺便提一下,
27 #+ 这个字符串变量可能会被设置一些非法字符.
28 : ${ThisVariable?}
29 echo "Value of ThisVariable is $ThisVariable".
30 echo
31 echo
32
33
34 : ${ZZXy23AB?"ZZXy23AB has not been set."}
35 # 如果变量ZZXy23AB没有被设置的话,
36 #+ 那么这个脚本会打印一个错误信息, 然后结束.

37
38 # 你可以自己指定错误消息.
39 # : ${variablename?"ERROR MESSAGE"}
40
41
42 # 等价于: dummy_variable=${ZZXy23AB?}
43 # dummy_variable=${ZZXy23AB?"ZXy23AB has not been set."}
44 # (dummy 的意思是“虚设的、假的、名义上的”)
45 # echo ${ZZXy23AB?} >/dev/null

46 (me:到这里俺终于明白特殊符号 ":" 在一个二元命令中提供一个占位符和默认参数的意思了。确切来说是明白了所谓的“二元命令”指啥了,扯远了,^_^)

1 : ${username=`whoami`}
2 # ${username=`whoami`} 如果没有开头的":"的话, 将会给出一个错误,
3 # 除非"username"是一个命令或者内建命令...

47 # 使用命令"set -u"来比较这些检查变量是否被设置的方法.
48 #
49
50
51
52 echo "You will not see this message, because script already terminated."
53
54 HERE=0
55 exit $HERE # 不会在这里退出.
56
57 # 事实上, 这个脚本将会以返回值1作为退出状态(echo $?).

例子 2. 参数替换和”usage”消息(译者注: 通常就是帮助信息)

  1 #!/bin/bash
2 # usage-message.sh
3
4 : ${1?"Usage: $0 ARGUMENT"}
5 # 如果没有提供命令行参数的话, 那么脚本就在这里退出了,
6 #+ 并且打印如下错误消息.
7 # usage-message.sh: 1: Usage: usage-message.sh ARGUMENT
8
9 echo "These two lines echo only if command-line parameter given."
10 echo "command line parameter = \"$1\""
11
12 exit 0 # 如果提供了命令行参数, 那么脚本就会在这里退出.
13
14 # 分别检查有命令行参数时和没有命令行参数时, 脚本的退出状态.
15 # 如果有命令行参数, 那么"$?"就是0.
16 # 如果没有的话, 那么"$?"就是1.

参数替换与(或)扩展.

下边这些表达式都是对如何在expr字符串操作中进行match的补充. 这些特定的使用方法一般都用来解析文件所在的目录名.

变量长度/子串删除

${#var}

字符串长度(变量$var得字符个数). 对于array来说, ${#array}表示的是数组中第一个元素的长度.

例外情况:

  • ${#*}和${#@}表示位置参数的个数.
  • 对于数组来说, ${#array[*]}和${#array[@]}表示数组中元素的个数.

例子 3. 变量长度

  1 #!/bin/bash
2 # length.sh
3
4 E_NO_ARGS=65
5
6 if [ $# -eq 0 ] # 这个演示脚本必须有命令行参数. 特殊变量 $# 表示命令行参数的个数
7 then
8 echo "Please invoke this script with one or more command-line arguments."
9 exit $E_NO_ARGS
10 fi
11
12 var01=abcdEFGH28ij
13 echo "var01 = ${var01}"
14 echo "Length of var01 = ${#var01}"
15 # 现在, 让我们试试在变量中嵌入一个空格.
16 var02="abcd EFGH28ij"
17 echo "var02 = ${var02}"
18 echo "Length of var02 = ${#var02}"
19
20 echo "Number of command-line arguments passed to script = ${#@}"
21 echo "Number of command-line arguments passed to script = ${#*}"
22
23 exit 0

${var#Pattern}, ${var##Pattern}

从变量 $var 的开头删除最短或最长匹配 $Pattern 的子串. (译者注: 这是一个很常见的用法, 请读者牢记, 一个”#”表示匹配最短, “##”表示匹配最长.)

用法示例:

  1 # 摘自例子"days-between.sh"的一个函数.
2 # 去掉传递进来参数开头的0.
3
4 strip_leading_zero () # 去掉从参数中传递进来的,
5 { #+ 可能存在的开头的0(也可能有多个0).
6 return=${1#0} # "1"表示的是"$1" -- 传递进来的参数.
7 } # "0"就是我们想从"$1"中删除的子串 -- 去掉零.

另一个用法示例:

  1 echo `basename $PWD`        # 当前工作目录的basename(就是去掉目录名).
2 echo "${PWD##*/}" # 当前工作目录的basename(就是去掉目录名).
3 echo
4 echo `basename $0` # 脚本名字.
5 echo $0 # 脚本名字.
6 echo "${0##*/}" # 脚本名字."0" 表示 "$0"
7 echo
8 filename=test.data
9 echo "${filename##*.}" # data
10 # 文件扩展名.

${var%Pattern}, ${var%%Pattern}

从变量 $var 的结尾删除最短或最长匹配 $Pattern 的子串. (译者注: 这是一个很常见的用法, 请读者牢记, 一个”%”表示匹配最短, “%%”表示匹配最长.)

例子 4. 修改文件扩展名:

  1 #!/bin/bash
2 # rfe.sh: 修改文件扩展名.
3 #
4 # 用法: rfe old_extension new_extension
5 #
6 # 示例:
7 # 将指定目录中所有的*.gif文件都重命名为*.jpg,
8 # 用法: rfe gif jpg
9
10
11 E_BADARGS=65
12
13 case $# in
14 0|1) # 竖线"|"在这里表示"或"操作.
15 echo "Usage: `basename $0` old_file_suffix new_file_suffix"
16 exit $E_BADARGS # 如果只有0个或1个参数的话, 那么就退出脚本.
17 ;;
18 esac

19
20
21 for filename in *.$1
22 # 以第一个参数为扩展名的全部文件的列表.
23 do
24 mv $filename ${filename%$1}$2
25 # 把筛选出来的文件的扩展名去掉, 因为筛选出来的文件的扩展名都是第一个参数,
26 #+ 然后把第2个参数作为扩展名, 附加到这些文件的后边.
27 done

28
29 exit 0

变量扩展/子串替换 这些结构都是从ksh中引入的.

${var:pos}

变量var从位置pos开始扩展(译者注: 也就是pos之前的字符都丢弃).
${var:pos:len}

变量var从位置pos开始, 并扩展len个字符.
${var/Pattern/Replacement}

使用Replacement来替换变量var中第一个匹配 Pattern 的字符串.

如果省略Replacement, 那么第一个匹配Pattern的字符串将被替换为空, 也就是被删除了.
${var//Pattern/Replacement}

全局替换. 所有在变量var匹配Pattern的字符串, 都会被替换为Replacement.

和上边一样, 如果省略Replacement, 那么所有匹配Pattern的字符串, 都将被替换为空, 也就是被删除掉.

(Pattern 为正则表达式)

例子 5. 使用模式匹配来解析任意字符串

  1 #!/bin/bash
2
3 var1=abcd-1234-defg
4 echo "var1 = $var1"
5
6 t=${var1#*-*}
7 echo "var1 (with everything, up to and including first - stripped out) = $t"
8 # t=${var1#*-} 也一样,
9 #+ 因为#匹配最短的字符串,
10 #+ 同时*匹配任意前缀, 包括空字符串
. (上面的语句执行后 $t 的值为 "123-defg")
11 # (感谢, Stephane Chazelas, 指出这点.)
12
13 t=${var1##*-*}
14 echo "If var1 contains a \"-\", returns empty string... var1 = $t"
15
16
17 t=${var1%*-*}
18 echo "var1 (with everything from the last - on stripped out) = $t"
19
20 echo
21
22 # -------------------------------------------
23 path_name=/home/bozo/ideas/thoughts.for.today
24 # -------------------------------------------
25 echo "path_name = $path_name"
26 t=${path_name##/*/}
27 echo "path_name, stripped of prefixes = $t"
28 # 在这个特例中, 与 t=`basename $path_name` 效果相同.
29 # t=${path_name%/}; t=${t##*/} 是更一般的解决方法.
30 #+ 但有时还是会失败.
31 # 如果$path_name以一个换行符结尾的话, 那么 `basename $path_name` 就不能正常工作了,
32 #+ 但是上边的表达式可以.
33 # (感谢, S.C.)
34
35 t=${path_name%/*.*}
36 # 与 t=`dirname $path_name` 效果相同.
37 echo "path_name, stripped of suffixes = $t"
38 # 在某些情况下将失效, 比如 "../", "/foo////", # "foo/", "/".
39 # 删除后缀, 尤其是在basename没有后缀的情况下,
40 #+ 但是dirname可以, 不过这同时也使问题复杂化了.
41 # (感谢, S.C.)
42
43 echo
44
45 t=${path_name:11} # bash 的索引从 “0” 开始计数
46 echo "$path_name, with first 11 chars stripped off = $t"
47 t=${path_name:11:5}
48 echo "$path_name, with first 11 chars stripped off, length 5 = $t"
49
50 echo
51
52 t=${path_name/bozo/clown}
53 echo "$path_name with \"bozo\" replaced by \"clown\" = $t"
54 t=${path_name/today/}
55 echo "$path_name with \"today\" deleted = $t"
56 t=${path_name//o/O}
57 echo "$path_name with all o's capitalized = $t"
58 t=${path_name//o/}
59 echo "$path_name with all o's deleted = $t"
60
61 exit 0

${var/#Pattern/Replacement}

如果变量var的前缀匹配Pattern, 那么就使用Replacement来替换匹配到Pattern的字符串.
${var/%Pattern/Replacement}

如果变量var的后缀匹配Pattern, 那么就使用Replacement来替换匹配到Pattern的字符串.

例子 6. 对字符串的前缀和后缀使用匹配模式

  1 #!/bin/bash
2 # var-match.sh:
3 # 对字符串的前缀和后缀进行模式替换的一个演示.
4
5 v0=abc1234zip1234abc # 变量原始值.
6 echo "v0 = $v0" # abc1234zip1234abc
7 echo
8
9 # 匹配字符串的前缀(开头).
10 v1=${v0/#abc/ABCDEF} # abc1234zip1234abc
11 # |-|
12 echo "v1 = $v1" # ABCDEF1234zip1234abc
13 # |----|
14
15 # 匹配字符串的后缀(结尾).
16 v2=${v0/%abc/ABCDEF} # abc1234zip123abc
17 # |-|
18 echo "v2 = $v2" # abc1234zip1234ABCDEF
19 # |----|
20
21 echo
22
23 # ----------------------------------------------------
24 # 必须匹配字符串的开头或结尾,
25 #+ 否则是不会产生替换结果的.
26 # ----------------------------------------------------
27 v3=${v0/#123/000} # 匹配, 但不是在开头.
28 echo "v3 = $v3" # abc1234zip1234abc
29 # 不会发生替换.
30 v4=${v0/%123/000} # 匹配, 但不是在结尾.
31 echo "v4 = $v4" # abc1234zip1234abc
32 # 不会发生替换.
33
34 exit 0

${!varprefix*}, ${!varprefix@}

匹配所有之前声明过的, 并且以varprefix开头的变量.

      1 xyz23=whatever
2 xyz24=
3
4 a=${!xyz*} # 展开所有以"xyz"开头的, 并且之前声明过的变量名.
5 echo "a = $a" # a = xyz23 xyz24
6 a=${!xyz@} # 同上.
7 echo "a = $a" # a = xyz23 xyz24
8
9 # Bash, 版本2.04, 添加了这个功能.

字符串操作

Bash所支持的字符串操作的数量多的令人惊讶. 但是不幸的是, 这些工具缺乏统一的标准. 一些是参数替换的子集, 而另外一些则受到UNIX expr命令的影响. 这就导致了命令语法的不一致, 还会引起冗余的功能, 但是这些并没有引起混乱.

字符串长度

${#string}

expr length $string

expr “$string” : ‘.*’

匹配字符串开头的子串长度

expr match “$string” ‘$substring’

$substring是一个正则表达式.
expr “$string” : ‘$substring’

$substring是一个正则表达式.

  1 stringZ=abcABC123ABCabc
2 # |------|
3
4 echo `expr match "$stringZ" 'abc[A-Z]*.2'` # 8
5 echo `expr "$stringZ" : 'abc[A-Z]*.2'` # 8

索引

expr index $string $substring

在字符串$string中所匹配到的$substring第一次所出现的位置.

提取子串

${string:position}

在$string中从位置$position开始提取子串.

如果$string是”*”或者”@”, 那么将会提取从位置$position开始的位置参数. (这适用于命令行参数或函数参数.)
${string:position:length}

在$string中从位置$position开始提取$length长度的子串.

  1 stringZ=abcABC123ABCabc
2 # 0123456789.....
3 # 0-based indexing.

4
5 echo ${stringZ:0} # abcABC123ABCabc
6 echo ${stringZ:1} # bcABC123ABCabc
7 echo ${stringZ:7} # 23ABCabc
8
9 echo ${stringZ:7:3} # 23A
10 # 提取子串长度为3.
11
12
13
14 # 能不能从字符串的右边(也就是结尾)部分开始提取子串?
15
16 echo ${stringZ:-4} # abcABC123ABCabc
17 # 默认是提取整个字符串, 就象${parameter:-default}一样.
18 # 然而 . . .
19
20 echo ${stringZ:(-4)} # Cabc
21 echo ${stringZ: -4} # Cabc
22 # 这样, 它就可以工作了.
23 # 使用圆括号或者添加一个空格可以"转义"这个位置参数.
24
25 # 感谢, Dan Jacobson, 指出这点.

如果$string参数是”*”或”@”, 那么将会从$position位置开始提取$length个位置参数, 但是由于可能没有$length个位置参数了, 那么就有几个位置参数就提取几个位置参数.

  1 echo ${*:2}          # 打印出第2个和后边所有的位置参数.
2 echo ${@:2} # 同上.
3
4 echo ${*:2:3} # 从第2个开始, 连续打印3个位置参数.

expr substr $string $position $length

在$string中从$position开始提取$length长度的子串.

      1 stringZ=abcABC123ABCabc
2 # 123456789......
3 # 以1开始计算.

4
5 echo `expr substr $stringZ 1 2` # ab
6 echo `expr substr $stringZ 4 3` # ABC

expr match “$string” ‘\($substring\)’

从$string的开始位置提取$substring, $substring是正则表达式.
expr “$string” : ‘\($substring\)’

从$string的开始位置提取$substring, $substring是正则表达式.

      1 stringZ=abcABC123ABCabc
2 # =======
3
4 echo `expr match "$stringZ" '\(.[b-c]*[A-Z]..[0-9]\)'` # abcABC1
5 echo `expr "$stringZ" : '\(.[b-c]*[A-Z]..[0-9]\)'` # abcABC1
6 echo `expr "$stringZ" : '\(.......\)'` # abcABC1
7 # 上边的每个echo都打印出相同的结果.

expr match “$string” ‘.*\($substring\)’

从$string的结尾提取$substring, $substring是正则表达式.
expr “$string” : ‘.*\($substring\)’

从$string的结尾提取$substring, $substring是正则表达式.

      1 stringZ=abcABC123ABCabc
2 # ======
3
4 echo `expr match "$stringZ" '.*\([A-C][A-C][A-C][a-c]*\)'` # ABCabc
5 echo `expr "$stringZ" : '.*\(......\)'` # ABCabc

子串削除

${string#substring}

从$string的开头位置截掉最短匹配的$substring.
${string##substring}

从$string的开头位置截掉最长匹配的$substring.
${string%substring}

从$string的结尾位置截掉最短匹配的$substring.
${string%%substring}

从$string的结尾位置截掉最长匹配的$substring.

当你需要构造文件名的时候, 这个操作就显得特别有用.(例如更改文件后缀名(格式)等)

子串替换

${string/substring/replacement}

使用$replacement来替换第一个匹配的$substring.
${string//substring/replacement}

使用$replacement来替换所有匹配的$substring.
${string/#substring/replacement}

如果$substring匹配$string的开头部分, 那么就用$replacement来替换$substring.
${string/%substring/replacement}

如果$substring匹配$string的结尾部分, 那么就用$replacement来替换$substring.

阅读(970) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~