Shell学习:基本语法

在学习和工作中shell的使用是相当普遍。为了跟上开源时代的步伐,我也得抽时间进行基础学习。

书名 作者 下载地址
Classic Shell Scripting Arnold R. & Nelson H.F.B 暂无
Advanced Bash-Scripting Guide Mendel Cooper PDF

shell主流版本有几个:sh bash csh ksh等,有一定的区别,我使用ubuntu默认就是bash,可以在脚本第一行加上这个"shebang"指示shell用到哪个版本

#~ /bin/bash

使用 chmod a+x this.sh 加上可执行属性,就可以 ./this.sh 运行该脚本。

Unix特殊字符有如下:使用其时要进行转义

 ( ; $ ? & * () [] ` ‘ “ + 

变量

POSIX内置的shell变量

名称 说明
# 目前进程的参数个数
@ 传递给当前进程的命令行参数,若置于双引号内,会展开为个别的参数
* 当前进程的的命令行参数。若置于双引号内,会展开为一个单独的参数
- (连字号) 在引用时给予shell的选项
? 前一命令的退出状态
$ shell的进程编号
0 Shell程序的名称
! 最后一个后台命令的进程编号
IFS 内部的字段分隔器,例如读取/etc/passwd可以用
PWD 当前工作目录

变量的赋值与修改

shell的默认赋值是字符串赋值。比如:

var=1 
var=$var+1 
echo $var 

打印出来的不是2而是1+1。为了达到我们想要的效果有以下几种表达方式:

let "var+=1" #let表示数学运算
var=$[$var+1] #$[]将中括号内的表达式作为数学运算先计算结果再输出
var=`expr $var + 1` #expr用于整数值运算,注意加号两边的空格,否则还是按照字符串的方式赋值。 

若要修改字符串

is_valid="False"
is_valid=$"True"
echo is_valid

expr运算符

expr运算符设计得不是那么严谨,而且很难用,主要用于以下四则混合算术运算:
加 减 乘 除 取mod
expr也是一个手工命令行计数器。

echo $(expr 30 / 3 / 2) #注意运算符左右都有空格 ,如果没有空格表示是字符串连接
echo $(expr 1500 + 900)
echo $(expr 30 \* 3) #使用乘号时,必须用反斜线转义

将输入数据转成数字

read a
a=`expr $a`

字符串替换

替换运算符:

名称 说明 常用场合
${varname:-word} 若varname存在且不是null,返回值,否则返回word 若count未被定义,则${count:-0}返回0
${varname:=name} 若varname存在且不是null,返回他的值,否则设置为word,返回该值 若count未被定义,则${count:=0}设置为0
${varname:?message} 若varname存在且非null,返回他的值,否则显示message,并退出脚本。 捕捉由于未定义变量所导致的错误 ${count:?"undefined!"}显示错误
${varname:+word} 若varname存在且非null,返回word,否则返回null 测试变量存在:若count已定义,${count:+1}

模式匹配运算符

使用wildcard通配符进行匹配。
假设测试字符串为:/home/tolstoy/mem/long.file.name

名称 说明
${variable#pattern} 若匹配变量值开头处,则删掉匹配最短部分。返回剩下的部分
${varialbe##pattern} 若模式匹配变量的开头处,则删除匹配最长部分,返回剩下部分
${variable%pattern} 若模式匹配变量结尾处,则删掉匹配最短部分。返回剩下的部分
${variable%%pattern} 若模式匹配变量结尾处,则删除匹配最长部分,返回剩下部分
测试:${path#/*/} 结果/tolstoy/mem/long.file.name
测试:${path##/*/} 结果long.file.name
测试:${path%.*} 结果/home/tolstoy/mem/long.file
测试:${path%.*} 结果/home/tolstoy/mem/long

模式匹配记忆方法:
# 是去掉左边(在键盘上#在$之左边)
% 是去掉右边(在键盘上%在$之右边)
#和%中的单一符号是最小匹配,两个相同符号是最大匹配。

删除

删除变量
unset -v variable
删除函数
unset -f function

逻辑语句

查看文档man test确定更复杂的表达式

for语句

1~9循环:

for ((i=1;i<10;++i))
do
    echo $i
done

打印每一行:

for i in read*.xml
do
    echo $i
    mv $i /tmp
done

嵌套循环中,break 命令后面还可以跟一个整数,表示跳出第几层循环

break 2 # jump out of loop 2

while语句

类似接下来的if语句,循环1~9

i=1
while [ $i -lt 10 ]
do
    echo $i
    ((i++))
done

与while循环相反的是until,只要conditon尚未满足,一直循环

#等待某人登陆
until who | grep "$user" > /dev/null
do
    sleep 20
done

if语句

考虑到兼容性,所有变量都应该用引号括起来。

if [ -f "$file" ] && [ -w "$file" ]
# 上面的&&要是否需要紧挨者方括号?
then
    # $file存在且为一般文件,但不可写入
    echo $0: $file is not writable >&2
elif [ -f "$file_1" ]
then
    echo bad
else
    echo exit.
fi

上面的>&2为输出到文件描述符,
0:stdin
1:stdout
2:stderr

很奇葩的i+1

i=1
if [ $i -le $((i+1)) ]; then
    echo hello
fi

case语句

每次总是漏掉最后的esac

case $1 in
-f) 
    # do something
    ;;
-d)
    # do something
    ;;
*)
    echo unknown
    exit 1
esac

其中;;不是必须的,不过是习惯,也方便编辑器的自动缩进。

输入输出

read可以读取多个变量

x=abc
printf "x is '%s' now, Enter a new value:" $x
read x
echo $x

使用重定向读取username和uid

while IFS=: read user pass uid gid fullname homedir shell
do
    echo "${user}"\'s uid is "${uid}"
done < /etc/passwd

上面使用了Shell变量IFS,能进行自动切割。使用read读取多个值,然后打印出来

一个拷贝目录结构的例子,对应这篇文章的新建目录

find /tmp/test -type d -print |
sed 's;/tmp/test/;/home/test/;' |
while read newdir
do
    mkdir ${newdir}
done

读取磁盘使用量,发送邮件给耗资源大户

cd /home
du -s * | # 获取磁盘使用量
sort -nr | # 按数字排列
sed 10q | #排序前十名
while read amount name
do
    mail -s "Disk Waring" ${name} <<- EOF  # 这里的EOF前面有横线
         pleas empty your disk space!
         EOF
done

注意EOF前面有个-符号,可以自动删掉前导的TAB字符,但无法删掉空格。
若去掉-,则实际文本中含有前导空格。

命令替换

反引号backticks(就是esc按键下面的的那个符号),表示返回计算值给上级
当出现多级嵌套很混乱。通常使用$(COMMANDS)代替

比较以下命令的异同

echo seq 1 10
echo `seq 1 10`
echo $(seq 1 10) # 建议使用这个

比较两个文件新旧版本的异同

for i in $(cd /tmp/old; echo *.c)
do
    diff -c /tmp/old/$i $i | less
done

将less移到外部,试试跟上面执行结果有什么不一样

for i in $(cd /tmp/old; echo *.c)
do
    diff -c /tmp/old/$i $i
done | less

括号总结

圆括号

单小括号 ()

  • 命令组。括号中的命令将会新开一个子shell顺序执行,所以括号中的变量不能够被脚本余下的部分使用。括号中多个命令之间用分号隔开,最后一个命令可以没有分号,各命令和括号之间不必有空格。
  • 命令替换。等同于`cmd`,shell扫描一遍命令行,发现了$(cmd)结构,便将$(cmd)中的cmd执行一次,得到其标准输出,再将此输出放到原来命令。有些shell不支持,如tcsh。
  • 用于初始化数组,空格隔开。如:array=(a b c d)

双小括号 (( ))

  • 整数扩展。这种扩展计算是整数型的计算,不支持浮点型。((exp))结构扩展并计算一个算术表达式的值,如果表达式的结果为0,那么返回的退出状态码为1,或者 是"假",而一个非零值的表达式所返回的退出状态码将为0,或者是"true"。若是逻辑判断,表达式exp为真则为1,假则为0。
  • 只要括号中的运算符、表达式符合C语言运算规则,都可用在$((exp))中,甚至是三目运算符。作不同进位(如二进制、八进制、十六进制)运算时,输出结果全都自动转化成了十进制。如:echo $((16#5f)) 结果为95 (16进位转十进制)
  • 单纯用 (( )) 也可重定义变量值,比如 a=5; ((a++)) 可实现c语言中的a++
  • 常用于算术运算比较,双括号中的变量可以不使用$符号前缀。括号内支持多个表达式用逗号分开。 只要括号中的表达式符合C语言运算规则,比如可以直接使用for((i=0;i<5;i++)), 如果不使用双括号, 则为for i in `seq 0 4`或者for i in {0..4}。再如可以直接使用if (($i<5)), 如果不使用双括号, 则为if [ $i -lt 5 ]。

例子

for i in $(seq 0 4);do echo $i;done    
for i in `seq 0 4`;do echo $i;done    
for ((i=0;i<5;i++));do echo $i;done    
for i in {0..4};do echo $i;done   

方括号

单中括号 []

  • bash 的内部命令,左括号[和test是等同的,右中括号]是关闭条件判断
  • Test和[]中可用的比较运算符只有==和!=,两者都是用于字符串比较的,不可用于整数比较,整数比较只能使用-eq,-gt这种形式。无论是字符串比较还是整数比较都不支持大于号小于号。如果实在想用,对于字符串比较可以使用转义形式,如果比较"ab"和"bc":[ ab < bc ],结果为真,也就是返回状态为0。[ ]中的逻辑与和逻辑或使用-a 和-o 表示。
  • 字符范围。用作正则表达式的一部分,描述一个匹配的字符范围。作为test用途的中括号内不能使用正则。
  • 在一个array 结构的上下文中,中括号用来引用数组中每个元素的编号。${array[3]}

双中括号[[ ]]

  • [[是 bash 程序语言的关键字。并不是一个命令,[[ ]] 结构比[ ]结构更加安全,但是有的shell不支持。在[[和]]之间所有的字符都不会发生文件名扩展或者单词分割,但是会发生参数扩展和命令替换。
  • 支持字符串的模式匹配,使用=~操作符时甚至支持shell的正则表达式。字符串比较时可以把右边的作为一个模式,而不仅仅是一个字符串,比如[[ hello == hell? ]],结果为真。[[ ]] 中匹配字符串或通配符,不需要引号。
  • 使用[[ ... ]]条件判断结构,而不是[ ... ],能够防止脚本中的许多逻辑错误。比如,&&、||、<和> 操作符能够正常存在于[[ ]]条件判断结构中,但是如果出现在[ ]结构中的话,会报错。比如可以直接使用if [[ $a != 1 && $a != 2 ]], 如果不适用双括号, 则为if [ $a -ne 1] && [ $a != 2 ]或者if [ $a -ne 1 -a $a != 2 ]。
  • bash把双中括号中的表达式看作一个单独的元素,并返回一个退出状态码。

例子

if ($i<5)    
if [ $i -lt 5 ]    
if [ $a -ne 1 -a $a != 2 ]    
if [ $a -ne 1] && [ $a != 2 ]    
if [[ $a != 1 && $a != 2 ]]    

大括号(花括号)

一、{}常规用法

  • 大括号拓展。(通配(globbing))将对大括号中的文件名做扩展。在大括号中,不允许有空白,除非这个空白被引用或转义。第一种:对大括号中的以逗号分割的文件列表进行拓展。如 touch {a,b}.txt 结果为a.txt b.txt。第二种:对大括号中以点点(..)分割的顺序文件列表起拓展作用,如:touch {a..d}.txt 结果为a.txt b.txt c.txt d.txt
  • 代码块,又被称为内部组,这个结构事实上创建了一个匿名函数 。与小括号中的命令不同,大括号内的命令不会新开一个子shell运行,即脚本余下部分仍可使用括号内变量。括号内的命令间用分号隔开,最后一个也必须有分号。{}的第一个命令和左括号之间必须要有一个空格。

二、特殊的替换(上面“变量”一节提到)

${var:-string},${var:+string},${var:=string},${var:?string}

三、模式匹配(上面“变量”一节提到)

 ${var%pattern},${var%%pattern},${var#pattern},${var##pattern}

四、字符串提取和替换

名称 说明
${var:num} 在var中提取第num个字符到末尾的所有字符。若num为正数,从左开始;若num为负数,从右开始
${var:pos:len} pos是位置,len是长度。表示从$var字符串的第$pos个位置开始提取长度len子串
${var/pattern1/pattern2} var字符串的第一个匹配的pattern1替换为pattern2
${var//pattern/pattern} var字符串的所有匹配的pattern1替换为pattern2

符号$后的括号

常见几种

  • ${a} 变量a的值, 在不引起歧义的情况下可以省略大括号
  • $(cmd) 命令替换,和`cmd`效果相同,某些Shell版本不支持$(cmd)
  • $((expression)) 和`expr expression`效果相同, 计算数学表达式exp的数值, 其中exp只要符合C语言的运算规则即可, 甚至三目运算符和逻辑表达式都可以计算。

括号多命令执行

(1)单小括号,(cmd1;cmd2;cmd3) 新开一个子shell顺序执行命令cmd1,cmd2,cmd3, 各命令之间用分号隔开, 最后一个命令后可以没有分号。
(2)单大括号,{ cmd1;cmd2;cmd3;} 在当前shell顺序执行命令cmd1,cmd2,cmd3, 各命令之间用分号隔开, 最后一个命令后必须有分号, 第一条命令和左括号之间必须用空格隔开。
(3)对{}和()而言, 括号中的重定向符只影响该条命令, 而括号外的重定向符影响到括号中的所有命令。

执行顺序与eval

这部分需要参考书籍《Classic Shell Scripting》了,无法用Markdown写成日志。
大致就是这个意思:将字符串转成shell执行的正常解析命令

例子:

listfile="ls | less"
$listfile
# 结果: 
# ls: 无法访问|: 没有那个文件或目录
# ls: 无法访问less: 没有那个文件或目录

说明shell执行字符串时候把“|” 和 “less” 看成ls的参数了,使得ls尝试在目录寻找 | 和 less 文件。。。
使用eval执行顺序可以重新解析成shell命令。

eval $listpage

其他

getopts shift $# 提供处理命令行的工具:自行查阅相关文档