2024年第三节:Bash编程易犯的错误
上一篇文章参见 第二节:Bash编程易犯的错误。
24. for arg in $*
和大多数 Shell 一样,Bash 支持依次读取单个命令行参数的语法。不过这并是$*或者$@,这两种写法都不正确,它们只能得到完整的参数列表,并非单独的一个个参数。
正确的语法是:
for arg in "$@"登录后复制
# 或者更简单的写法
for arg登录后复制
在脚本中遍历所有参数是一个再普遍不过的需求,所以 for arg 默认等价于 for arg in "$@"。$@使用双引号后就有特殊的魔力,每个参数展开后成为一个独立的单词。
下面是一个错误的例子:
for x in $*; do echo "parameter: '$x'" done 执行的结果为: $ ./myscript 'arg 1' arg2 arg3 parameter: 'arg' parameter: '1' parameter: 'arg2' parameter: 'arg3'登录后复制
正确的写法:
for x in "$@"; do echo "parameter: '$x'" done 执行的结果为: $ ./myscript 'arg 1' arg2 arg3 parameter: 'arg 1' parameter: 'arg2' parameter: 'arg3'登录后复制
上面正确的例子中,第一个参数'arg 1'在展开后依然是一个独立的单词,而不会被拆分成两个。
25. function foo()
这种写法不一定能够兼容所有 shell,兼容的写法是:
foo() { ... }登录后复制
26. echo "~"
波浪号展开仅当~没有引号的时候发生,在上面的例子中,只会向标准输出打印~符号,而不是当前用户的家目录路径。
当用引号将路径参数引起来时,如果要用引号将相对于家目录的路径引起来时,推荐使用 $HOME 而不是 ~, 假如 $HOME 目录是"/home/my photos",路径中包含空格。
下面是几组例子:
"~/dir with spaces" # expands to "~/dir with spaces" ~"/dir with spaces" # expands to "~/dir with spaces" ~/"dir with spaces" # expands to "/home/my photos/dir with spaces" "$HOME/dir with spaces" # expands to "/home/my photos/dir with spaces"登录后复制
27. local varname=$(command)
当在函数中声明局部变量时,local作为一个独立的命令,这种奇特的行为有时候可能会导致困扰。比如,当你想要捕获命令替换的返回码时,你就不能这样做。local命令的返回码会覆盖它。
这种情况下,你只能分成两行写:
local varname varname=$(command) rc=$?登录后复制
28. export foo=~/bar
export 与 local 命令一样,并不是赋值语句的一部分。因此,在有些 Shell 下,export foo=~/bar会展开,但是有些却不行。
下面是两种比较健壮的写法:
foo=~/bar; export foo # Right! export foo="$HOME/bar" # Right!登录后复制
29. sed 's/$foo/good bye/'
单引号内部不会展开 $foo变量,在这里可以换成双引号:
foo="hello"; sed "s/$foo/good bye/"登录后复制
但是要注意,如果你使用了双引号,就需要考虑更多转义的事情,具体可以看Quotes这一页。.
30. tr [A-Z] [a-z]
这里至少有三个问题。第一个问题是, [A-Z] 和 [a-z] 会被 shell 认为是通配符。如果在当前目录下没用文件名为单个字母的文件,这个命令似乎能正确执行,否则会错误地执行,也许你会在周末耗费许多小时来修复这个问题。
第二个问题是,这不是 tr 命令正确的写法,实际上,上面的命令会把[转换成[,将任意大写字符转换成对应的小写字符,将]转换成],所以你根本不需要加上括号,这样第一个问题就可以解决了。
第三个问题是,上面的命令执行结果依赖于当前的 locale,A-Z 或者 a-z 不一定会代表26个 ASCII 字母。实际上,在一些语言环境下,z 位于字母表的中间位置。这个问题的解法,取决于你希望发生的行为是哪一种。
如果你仅希望改变26个英文字母的大小写:
LC_COLLATE=C tr A-Z a-z 如果你希望根据实际的语言环境来转换: tr '[:upper:]' '[:lower:]'登录后复制
31. ps ax | grep gedit
这里的根本问题是正在运行的进程名称,本质上是不可靠的。可能会有多个合法的gedit进程,也有可能是别的东西伪装成gedit进程,更多细节可以看ProcessManagement这一篇文章。
执行以上命令,往往会在结果中包含 grep 进程:
# ps ax | grep gedit 10530 ? S 6:23 gedit 32118 pts/0 R+ 0:00 grep gedit 这个时候,需要过滤多余的结果: # ps ax | grep -v grep | grep gedit 上面的写法比较丑陋,另外一种方法是: # ps ax | grep [g]edit登录后复制
32. printf "$foo"
如果$foo 变量的值中包括或者%符号,上面命令的执行结果可能会出乎你的意料之外。
下面是正确的写法:
printf %s "$foo" printf '%s ' "$foo"登录后复制
33. for i in {1..$n}
Bash的命令解释器会优先展开大括号,所以这时大括号{}表达式里面看到的是文字上的$n。$n 不是一个数值,所以这里的大括号{}并不会展开成数字列表。可见,这导致很难使用大括号来展开大小只能在运行时才知道的列表。
可以用下面的方法:
for ((i=1; i< =n; i++)); do ... done登录后复制
注:之前我也有写过一篇文章来介绍这个问题:Shell生成数字序列。
34. if [[ $foo = $bar ]]
在[[内部,当=号右边的值没有用引号引起来,bash 会将它当作模式来匹配,而不是一个简单的字符串。所以,在上面的例子中 ,如果 bar 的值是一个*号,执行的结果永远是 true。
所以,如果你想检查两侧的字符串是否相同,等号右侧的值一定要用引号引起来。
if [[ $foo = "$bar" ]]登录后复制
如果你确实要执行模式匹配,聪明的做法是取一个更加有意义的变量名,或者加上注释说明。
35. if [[ $foo =~ 'some RE' ]]
同上,如果=~号右侧的值加上引号,它会散失特殊的正则表达式含义,而变成一个普通的字符串。
如果你想使用一个长的或者复杂的正则表达式,避免大量的反斜杠转义,建议把它放在一个变量中:
re='some RE' if [[ $foo =~ $re ]]登录后复制
由于篇幅限制,本系列文章会分成多篇文章,最后一篇参见 第四节:Bash编程易犯的错误。