共计 2873 个字符,预计需要花费 8 分钟才能阅读完成。
上一篇文章参见 第二节:Bash 编程易犯的错误。
24. for arg in $*
和大多数 Shell 一样,Bash 支持依次读取单个命令行参数的语法。不过这并是 $* 或者 $@,这两种写法都不正确,它们只能得到完整的参数列表,并非单独的一个个参数。
正确的语法是(没错要加上引号):
for arg in "$@"
# 或者更简单的写法
for arg
在脚本中遍历所有参数是一个再普遍不过的需求,所以 for arg 默认等价于 for arg in “$@”。$@使用双引号后就有特殊的魔力,每个参数展开后成为一个独立的单词。(”$@” 等价于 ”$1” “$2” “$3” …)
下面是一个错误的例子:
for x in $*; do
echo "parameter:'$x'"
done
执行的结果为:$ ./myscript 'arg 1' arg2 arg3
parameter: 'arg'
parameter: '1'
parameter: 'arg2'
parameter: 'arg3'
正确的写法:
for x in "$@"; do
echo "parameter:'$x'"
done
执行的结果为:$ ./myscript 'arg 1' arg2 arg3
parameter: 'arg 1'
parameter: 'arg2'
parameter: 'arg3'
上面正确的例子中,第一个参数 ’arg 1’ 在展开后依然是一个独立的单词,而不会被拆分成两个。
25. function foo()
这种写法不一定能够兼容所有 shell,兼容的写法是:
foo() {...}
26. echo “~”
波浪号展开(Tilde expansion)仅当~ 没有引号的时候发生,在上面的例子中,只会向标准输出打印~ 符号,而不是当前用户的家目录路径。
当用引号将路径参数引起来时,如果要用引号将相对于家目录的路径引起来时,推荐使用 $HOME 而不是 ~, 假如 $HOME 目录是 ”/home/my photos”,路径中包含空格。
下面是几组例子:
"~/dir with spaces" # expands to "~/dir with spaces"
~"/dir with spaces" # expands to "~/dir with spaces"
~/"dir with spaces" # expands to "/home/my photos/dir with spaces"
"$HOME/dir with spaces" # expands to "/home/my photos/dir with spaces"
27. local varname=$(command)
当在函数中声明局部变量时,local 作为一个独立的命令,这种奇特的行为有时候可能会导致困扰。比如,当你想要捕获命令替换的返回码时,你就不能这样做。local 命令的返回码会覆盖它。
这种情况下,你只能分成两行写:
local varname
varname=$(command)
rc=$?
28. export foo=~/bar
export 与 local 命令一样,并不是赋值语句的一部分。因此,在有些 Shell 下(比如 Bash),export foo=~/bar 会展开,但是有些(比如 Dash)却不行。
下面是两种比较健壮的写法:
foo=~/bar; export foo # Right!
export foo="$HOME/bar" # Right!
29. sed ‘s/$foo/good bye/’
单引号内部不会展开 $foo 变量,在这里可以换成双引号:
foo="hello"; sed "s/$foo/good bye/"
但是要注意,如果你使用了双引号,就需要考虑更多转义的事情,具体可以看 Quotes 这一页。.
30. tr [A-Z] [a-z]
这里至少有三个问题。第一个问题是,[A-Z] 和 [a-z] 会被 shell 认为是通配符。如果在当前目录下没用文件名为单个字母的文件,这个命令似乎能正确执行,否则会错误地执行,也许你会在周末耗费许多小时来修复这个问题。
第二个问题是,这不是 tr 命令正确的写法,实际上,上面的命令会把 [转换成[,将任意大写字符转换成对应的小写字符,将] 转换成],所以你根本不需要加上括号,这样第一个问题就可以解决了。
第三个问题是,上面的命令执行结果依赖于当前的 locale,A-Z 或者 a-z 不一定会代表 26 个 ASCII 字母。实际上,在一些语言环境下,z 位于字母表的中间位置。这个问题的解法,取决于你希望发生的行为是哪一种。
如果你仅希望改变 26 个英文字母的大小写(强制 locale 为 C):
LC_COLLATE=C tr A-Z a-z
如果你希望根据实际的语言环境来转换:tr '[:upper:]' '[:lower:]'
31. ps ax | grep gedit
这里的根本问题是正在运行的进程名称,本质上是不可靠的。可能会有多个合法的 gedit 进程,也有可能是别的东西伪装成 gedit 进程(改变执行命令名称是一件简单的事情), 更多细节可以看 ProcessManagement 这一篇文章。
执行以上命令,往往会在结果中包含 grep 进程:
# ps ax | grep gedit
10530 ? S 6:23 gedit
32118 pts/0 R+ 0:00 grep gedit
这个时候,需要过滤多余的结果:# ps ax | grep -v grep | grep gedit
上面的写法比较丑陋,另外一种方法是:# ps ax | grep [g]edit
32. printf “$foo”
如果 $foo 变量的值中包括 \ 或者 % 符号,上面命令的执行结果可能会出乎你的意料之外。
下面是正确的写法:
printf %s "$foo"
printf '%s\n' "$foo"
33. for i in {1..$n}
Bash 的命令解释器会优先展开大括号,所以这时大括号 {} 表达式里面看到的是文字上的 $n(没有展开)。$n 不是一个数值,所以这里的大括号 {} 并不会展开成数字列表。可见,这导致很难使用大括号来展开大小只能在运行时才知道的列表。
可以用下面的方法:
for ((i=1; i
注:之前我也有写过一篇文章来介绍这个问题:Shell 生成数字序列。
34. if [[$foo = $bar]]
在[[内部,当 = 号右边的值没有用引号引起来,bash 会将它当作模式来匹配,而不是一个简单的字符串。所以,在上面的例子中,如果 bar 的值是一个 * 号,执行的结果永远是 true。
所以,如果你想检查两侧的字符串是否相同,等号右侧的值一定要用引号引起来。
if [[$foo = "$bar"]]
如果你确实要执行模式匹配,聪明的做法是取一个更加有意义的变量名(例如 $patt),或者加上注释说明。
35. if [[$foo =~ 'some RE']]
同上,如果 =~ 号右侧的值加上引号,它会散失特殊的正则表达式含义,而变成一个普通的字符串。
如果你想使用一个长的或者复杂的正则表达式,避免大量的反斜杠转义,建议把它放在一个变量中:
re='some RE'
if [[$foo =~ $re]]
由于篇幅限制,本系列文章会分成多篇文章,最后一篇参见 第四节:Bash 编程易犯的错误。