Shell学习：基本语法

发表于 2016年1月17日分类于读书笔记

在学习和工作中shell的使用是相当普遍。为了跟上开源时代的步伐，我也得抽时间进行基础学习。

书名	作者	下载地址
Classic Shell Scripting	Arnold R. & Nelson H.F.B	暂无
Advanced Bash-Scripting Guide	Mendel Cooper	PDF

shell主流版本有几个：sh bash csh ksh等，有一定的区别，我使用ubuntu默认就是bash，可以在脚本第一行加上这个"shebang"指示shell用到哪个版本

#~ /bin/bash

使用 chmod a+x this.sh 加上可执行属性，就可以 ./this.sh 运行该脚本。

Unix特殊字符有如下：使用其时要进行转义

 ( ; $ ? & * () [] ` ‘ “ +

变量

POSIX内置的shell变量

名称	说明
#	目前进程的参数个数
@	传递给当前进程的命令行参数，若置于双引号内，会展开为个别的参数
*	当前进程的的命令行参数。若置于双引号内，会展开为一个单独的参数
-	(连字号) 在引用时给予shell的选项
?	前一命令的退出状态
$	shell的进程编号
0	Shell程序的名称
!	最后一个后台命令的进程编号
IFS	内部的字段分隔器，例如读取/etc/passwd可以用
PWD	当前工作目录

变量的赋值与修改

shell的默认赋值是字符串赋值。比如：

var=1 
var=$var+1 
echo $var

打印出来的不是2而是1＋1。为了达到我们想要的效果有以下几种表达方式：

let "var+=1" #let表示数学运算
var=$[$var+1] #$[]将中括号内的表达式作为数学运算先计算结果再输出
var=`expr $var + 1` #expr用于整数值运算，注意加号两边的空格，否则还是按照字符串的方式赋值。

若要修改字符串

is_valid="False"
is_valid=$"True"
echo is_valid

expr运算符

expr运算符设计得不是那么严谨，而且很难用，主要用于以下四则混合算术运算：
加减乘除取mod
expr也是一个手工命令行计数器。

echo $(expr 30 / 3 / 2) #注意运算符左右都有空格 ，如果没有空格表示是字符串连接
echo $(expr 1500 + 900)
echo $(expr 30 \* 3) #使用乘号时，必须用反斜线转义

将输入数据转成数字

read a
a=`expr $a`

字符串替换

替换运算符：

名称	说明	常用场合
${varname:-word}	若varname存在且不是null，返回值，否则返回word	若count未被定义，则${count:-0}返回0
${varname:=name}	若varname存在且不是null，返回他的值，否则设置为word，返回该值	若count未被定义，则${count:=0}设置为0
${varname:?message}	若varname存在且非null，返回他的值，否则显示message，并退出脚本。	捕捉由于未定义变量所导致的错误 ${count:?"undefined!"}显示错误
${varname:+word}	若varname存在且非null，返回word，否则返回null	测试变量存在:若count已定义，${count:+1}

模式匹配运算符

使用wildcard通配符进行匹配。
假设测试字符串为：/home/tolstoy/mem/long.file.name

名称	说明
${variable#pattern}	若匹配变量值开头处，则删掉匹配最短部分。返回剩下的部分
${varialbe##pattern}	若模式匹配变量的开头处，则删除匹配最长部分，返回剩下部分
${variable%pattern}	若模式匹配变量结尾处，则删掉匹配最短部分。返回剩下的部分
${variable%%pattern}	若模式匹配变量结尾处，则删除匹配最长部分，返回剩下部分

测试：${path#/*/} 结果/tolstoy/mem/long.file.name
测试：${path##/*/} 结果long.file.name
测试：${path%.*} 结果/home/tolstoy/mem/long.file
测试：${path%.*} 结果/home/tolstoy/mem/long

模式匹配记忆方法：
# 是去掉左边(在键盘上#在$之左边)
% 是去掉右边(在键盘上%在$之右边)
#和%中的单一符号是最小匹配，两个相同符号是最大匹配。

删除

删除变量
unset -v variable
删除函数
unset -f function

逻辑语句

查看文档man test确定更复杂的表达式

for语句

1~9循环：

for ((i=1;i<10;++i))
do
    echo $i
done

打印每一行：

for i in read*.xml
do
    echo $i
    mv $i /tmp
done

嵌套循环中，break 命令后面还可以跟一个整数，表示跳出第几层循环

break 2 # jump out of loop 2

while语句

类似接下来的if语句，循环1~9

i=1
while [ $i -lt 10 ]
do
    echo $i
    ((i++))
done

与while循环相反的是until，只要conditon尚未满足，一直循环

#等待某人登陆
until who | grep "$user" > /dev/null
do
    sleep 20
done

if语句

考虑到兼容性，所有变量都应该用引号括起来。

if [ -f "$file" ] && [ -w "$file" ]
# 上面的&&要是否需要紧挨者方括号?
then
    # $file存在且为一般文件，但不可写入
    echo $0: $file is not writable >&2
elif [ -f "$file_1" ]
then
    echo bad
else
    echo exit.
fi

上面的>&2为输出到文件描述符，
0:stdin
1:stdout
2:stderr

很奇葩的i+1

i=1
if [ $i -le $((i+1)) ]; then
    echo hello
fi

case语句

每次总是漏掉最后的esac

case $1 in
-f) 
    # do something
    ;;
-d)
    # do something
    ;;
*)
    echo unknown
    exit 1
esac

其中;;不是必须的，不过是习惯,也方便编辑器的自动缩进。

输入输出

read可以读取多个变量

x=abc
printf "x is '%s' now, Enter a new value:" $x
read x
echo $x

使用重定向读取username和uid

while IFS=: read user pass uid gid fullname homedir shell
do
    echo "${user}"\'s uid is "${uid}"
done < /etc/passwd

上面使用了Shell变量IFS，能进行自动切割。使用read读取多个值，然后打印出来

一个拷贝目录结构的例子，对应这篇文章的新建目录

find /tmp/test -type d -print |
sed 's;/tmp/test/;/home/test/;' |
while read newdir
do
    mkdir ${newdir}
done

读取磁盘使用量，发送邮件给耗资源大户

cd /home
du -s * | # 获取磁盘使用量
sort -nr | # 按数字排列
sed 10q | #排序前十名
while read amount name
do
    mail -s "Disk Waring" ${name} <<- EOF  # 这里的EOF前面有横线
         pleas empty your disk space!
         EOF
done

注意EOF前面有个-符号，可以自动删掉前导的TAB字符，但无法删掉空格。
若去掉-，则实际文本中含有前导空格。

命令替换

反引号backticks（就是esc按键下面的的那个符号），表示返回计算值给上级
当出现多级嵌套很混乱。通常使用$(COMMANDS)代替

比较以下命令的异同

echo seq 1 10
echo `seq 1 10`
echo $(seq 1 10) # 建议使用这个

比较两个文件新旧版本的异同

for i in $(cd /tmp/old; echo *.c)
do
    diff -c /tmp/old/$i $i | less
done

将less移到外部，试试跟上面执行结果有什么不一样

for i in $(cd /tmp/old; echo *.c)
do
    diff -c /tmp/old/$i $i
done | less

括号总结

圆括号

单小括号 ()

命令组。括号中的命令将会新开一个子shell顺序执行，所以括号中的变量不能够被脚本余下的部分使用。括号中多个命令之间用分号隔开，最后一个命令可以没有分号，各命令和括号之间不必有空格。
命令替换。等同于`cmd`，shell扫描一遍命令行，发现了$(cmd)结构，便将$(cmd)中的cmd执行一次，得到其标准输出，再将此输出放到原来命令。有些shell不支持，如tcsh。
用于初始化数组,空格隔开。如：array=(a b c d)

双小括号 (( ))

整数扩展。这种扩展计算是整数型的计算，不支持浮点型。((exp))结构扩展并计算一个算术表达式的值，如果表达式的结果为0，那么返回的退出状态码为1，或者是"假"，而一个非零值的表达式所返回的退出状态码将为0，或者是"true"。若是逻辑判断，表达式exp为真则为1,假则为0。
只要括号中的运算符、表达式符合C语言运算规则，都可用在$((exp))中，甚至是三目运算符。作不同进位(如二进制、八进制、十六进制)运算时，输出结果全都自动转化成了十进制。如：echo $((16#5f)) 结果为95 (16进位转十进制)
单纯用 (( )) 也可重定义变量值，比如 a=5; ((a++)) 可实现c语言中的a++
常用于算术运算比较，双括号中的变量可以不使用$符号前缀。括号内支持多个表达式用逗号分开。只要括号中的表达式符合C语言运算规则,比如可以直接使用for((i=0;i<5;i++)), 如果不使用双括号, 则为for i in `seq 0 4`或者for i in {0..4}。再如可以直接使用if (($i<5)), 如果不使用双括号, 则为if [ $i -lt 5 ]。

例子

for i in $(seq 0 4);do echo $i;done    
for i in `seq 0 4`;do echo $i;done    
for ((i=0;i<5;i++));do echo $i;done    
for i in {0..4};do echo $i;done

方括号

单中括号 []

bash 的内部命令，左括号[和test是等同的，右中括号]是关闭条件判断
Test和[]中可用的比较运算符只有==和!=，两者都是用于字符串比较的，不可用于整数比较，整数比较只能使用-eq，-gt这种形式。无论是字符串比较还是整数比较都不支持大于号小于号。如果实在想用，对于字符串比较可以使用转义形式，如果比较"ab"和"bc"：[ ab < bc ]，结果为真，也就是返回状态为0。[ ]中的逻辑与和逻辑或使用-a 和-o 表示。
字符范围。用作正则表达式的一部分，描述一个匹配的字符范围。作为test用途的中括号内不能使用正则。
在一个array 结构的上下文中，中括号用来引用数组中每个元素的编号。${array[3]}

双中括号[[ ]]

[[是 bash 程序语言的关键字。并不是一个命令，[[ ]] 结构比[ ]结构更加安全，但是有的shell不支持。在[[和]]之间所有的字符都不会发生文件名扩展或者单词分割，但是会发生参数扩展和命令替换。
支持字符串的模式匹配，使用=~操作符时甚至支持shell的正则表达式。字符串比较时可以把右边的作为一个模式，而不仅仅是一个字符串，比如[[ hello == hell? ]]，结果为真。[[ ]] 中匹配字符串或通配符，不需要引号。
使用[[ ... ]]条件判断结构，而不是[ ... ]，能够防止脚本中的许多逻辑错误。比如，&&、||、<和> 操作符能够正常存在于[[ ]]条件判断结构中，但是如果出现在[ ]结构中的话，会报错。比如可以直接使用if [[ $a != 1 && $a != 2 ]], 如果不适用双括号, 则为if [ $a -ne 1] && [ $a != 2 ]或者if [ $a -ne 1 -a $a != 2 ]。
bash把双中括号中的表达式看作一个单独的元素，并返回一个退出状态码。

例子

if ($i<5)    
if [ $i -lt 5 ]    
if [ $a -ne 1 -a $a != 2 ]    
if [ $a -ne 1] && [ $a != 2 ]    
if [[ $a != 1 && $a != 2 ]]

大括号（花括号）

一、{}常规用法

大括号拓展。(通配(globbing))将对大括号中的文件名做扩展。在大括号中，不允许有空白，除非这个空白被引用或转义。第一种：对大括号中的以逗号分割的文件列表进行拓展。如 touch {a,b}.txt 结果为a.txt b.txt。第二种：对大括号中以点点（..）分割的顺序文件列表起拓展作用，如：touch {a..d}.txt 结果为a.txt b.txt c.txt d.txt
代码块，又被称为内部组，这个结构事实上创建了一个匿名函数。与小括号中的命令不同，大括号内的命令不会新开一个子shell运行，即脚本余下部分仍可使用括号内变量。括号内的命令间用分号隔开，最后一个也必须有分号。{}的第一个命令和左括号之间必须要有一个空格。

二、特殊的替换（上面“变量”一节提到）

${var:-string},${var:+string},${var:=string},${var:?string}

三、模式匹配（上面“变量”一节提到）

 ${var%pattern},${var%%pattern},${var#pattern},${var##pattern}

四、字符串提取和替换

名称	说明
${var:num}	在var中提取第num个字符到末尾的所有字符。若num为正数，从左开始；若num为负数，从右开始
${var:pos:len}	pos是位置，len是长度。表示从$var字符串的第$pos个位置开始提取长度len子串
${var/pattern1/pattern2}	var字符串的第一个匹配的pattern1替换为pattern2
${var//pattern/pattern}	var字符串的所有匹配的pattern1替换为pattern2

符号$后的括号

常见几种

${a} 变量a的值, 在不引起歧义的情况下可以省略大括号
$(cmd) 命令替换，和`cmd`效果相同，某些Shell版本不支持$(cmd)
$((expression)) 和`expr expression`效果相同, 计算数学表达式exp的数值, 其中exp只要符合C语言的运算规则即可, 甚至三目运算符和逻辑表达式都可以计算。

括号多命令执行

（1）单小括号，(cmd1;cmd2;cmd3) 新开一个子shell顺序执行命令cmd1,cmd2,cmd3, 各命令之间用分号隔开, 最后一个命令后可以没有分号。
（2）单大括号，{ cmd1;cmd2;cmd3;} 在当前shell顺序执行命令cmd1,cmd2,cmd3, 各命令之间用分号隔开, 最后一个命令后必须有分号, 第一条命令和左括号之间必须用空格隔开。
（3）对{}和()而言, 括号中的重定向符只影响该条命令，而括号外的重定向符影响到括号中的所有命令。

执行顺序与eval

这部分需要参考书籍《Classic Shell Scripting》了，无法用Markdown写成日志。
大致就是这个意思：将字符串转成shell执行的正常解析命令

例子：

listfile="ls | less"
$listfile
# 结果： 
# ls: 无法访问|: 没有那个文件或目录
# ls: 无法访问less: 没有那个文件或目录

说明shell执行字符串时候把“|” 和 “less” 看成ls的参数了，使得ls尝试在目录寻找 | 和 less 文件。。。
使用eval执行顺序可以重新解析成shell命令。

eval $listpage

其他

getopts shift $# 提供处理命令行的工具：自行查阅相关文档