Bash
Shell? sh? bash?
- Shell是通用术语,泛指命令行解释器,而 bash 和 sh 是具体的Shell实现。
- 在Unix和Linux系统中,常见的Shell包括Bourne Shell(sh)、Bourne-Again Shell(bash)、C Shell(csh)、Korn Shell(ksh)等。
- sh是最基本的Shell,是Unix系统的原始Shell,兼容性较好,但功能相对有限。
- sh是Unix原始的标准Shell解释器,也被称为Bourne Shell,最早由史蒂芬·伯恩斯(Stephen Bourne)开发。
- 在许多Unix系统中,
/bin/sh
通常是Bourne Shell或其兼容的链接。 - 在一些Linux发行版中,
/bin/sh
可能是指向bash的符号链接,因此在这些系统中,sh
与bash
之间的差异可能不那么明显。
- bash是对sh的扩展,提供了更多功能和便利的特性,是许多Linux系统的默认Shell。
- bash是Bourne-Again Shell的缩写,是GNU项目的一部分,在许多现代Unix和Linux系统中默认的Shell。
- bash是对Bourne Shell的增强和扩展版本,提供了更多功能,例如命令补全、多行命令编辑、作业控制等。
- 在许多脚本中,
#!/bin/bash
用于指定脚本应该由bash解释器来执行。(参见[[Missing.01 Shell#shebang!
|shebang]])
在现代系统中,一般将/bin/sh
符号链接到bash,因此可以在脚本中使用#!/bin/sh
或#!/bin/bash
来执行脚本,两者通常是等效的。
Shell 脚本
shell 脚本针对 shell 所从事的相关工作进行来优化。因此,创建命令流程(pipelines)、将结果保存到文件、从标准输入中读取输入,这些都是 shell 脚本中的原生操作,这让它比通用的脚本语言更易用。
赋值与访问变量
- 赋值
- ==
foo = bar
不能工作!==解释器会调用程序foo
并将=
和bar
作为参数 - 正确写法:
foo=bar
- ==
- 访问
$foo
字符串
- 字符串通过
'
和"
分隔符来定义'
原义字符串,变量不会被转义"
会将变量值进行替换
条件、循环
bash 支持 if
, else
, while
, for
等
#!/bin/bash
# if...then...else...fi 语法示例
read -p "Enter a number: " num
if [[ $num -gt 0 ]]; then
echo "The number is positive."
else
echo "The number is not positive."
fi
# while...do...done 循环语法示例
counter=1
while [[ $counter -le 5 ]]; do
echo "Iteration: $counter"
((counter++))
done
# for..do...done 循环语法示例
for fruit in apple banana orange; do
echo "I like $fruit"
done
一些注解
在Bash脚本中,双圆括号 ((...))
是用来执行算术运算的。在Shell中,通常使用 ((...))
来进行整数运算和表达式求值,而不需要使用 $
符号获取变量的值。
在 ((counter++))
中,counter++
是一个自增操作,((...))
让Shell知道需要执行的是一个数学运算,而不是简单的字符串操作或命令替换。这样做可以确保 counter
变量按预期递增。
在Bash脚本中,条件判断通常使用方括号 [ ]
或 [[ ]]
来包裹条件表达式。在这个上下文中,-gt
是一个用于数值比较的运算符,表示“greater than”(大于)。因此, [ $num -gt 0 ]
表示当 num
的值大于0时条件成立。
Bash中没有提供 >
运算符用于比较大小,因此不能直接写成 $num > 0
。
类似的有:-eq
, -neq
, -lt
, -le
, -gt
, -ge
Bash实现了许多类似的比较操作,您可以查看 test 手册
。
在bash中进行比较时,尽量使用双方括号 [[ ]]
而不是单方括号 [ ]
,这样会降低犯错的几率,尽管这样并不能兼容 sh
。 更详细的说明参见这里。
函数
下面这个函数是一个例子,它会创建一个文件夹并使用cd
进入该文件夹。
这里 $1
是脚本的第一个参数。
特殊的参数
$0
- 脚本名$1
到$9
- 脚本的参数。$1
是第一个参数,依此类推。$@
- 所有参数$#
- 参数个数$?
- 前一个命令的返回值(AKA 退出码 / 返回码)$$
- 当前脚本的进程识别码!!
- 完整的上一条命令,包括参数。常见应用:当你因为权限不足执行命令失败时,可以使用sudo !!
再尝试一次。$_
- 上一条命令的最后一个参数。如果你正在使用的是交互式 shell,你可以通过按下Esc
之后键入 . 来获取这个值。
更完整的列表可以参考 这里。
返回
命令通常使用 STDOUT
来返回输出值,使用STDERR
来返回错误及错误码。
返回码或退出状态是脚本/命令之间交流执行状态的方式。
返回值 0 表示正常执行,其他所有非0的返回值都表示有错误发生。
退出码可以搭配 &&
(与操作符)和 ||
(或操作符)使用,用来进行条件判断,决定是否执行其他程序。
它们都属于短路运算符(short-circuiting) 同一行的多个命令可以用 ;
分隔。
false || echo "Oops, fail" # 未短路
# Oops, fail
true || echo "Will not be printed" # 短路
#
true && echo "Things went well" # 未短路
# Things went well
false && echo "Will not be printed" # 短路
#
false ; echo "This will always run"
# This will always run
返回码 | 含义 |
---|---|
0 | 操作成功完成 |
1 | 一般性错误 |
2 | 参数错误,通常指无效或不正确的输入参数 |
126 | 不能执行 |
127 | 命令未找到 |
128 | exit 参数错误,exit 只能用整数作为参数 |
128 + n | 信号 n 的致命错误 如 kill -9 脚本的 PID,则返回137(128+9) |
130 | Ctrl + C 结束脚本(信号 2) |
255 | 程序退出状态,通常表示异常终止或错误退出 |
-1 | 通用错误码,有时表示未指定的错误或未知错误 |
程序 true
的返回码永远是0
(代表正常完成),false
的返回码永远是1
。
命令替换 / 进程替换
以变量的形式获取一个命令的输出
命令替换(command substitution)
通过 $( CMD )
这样的方式来执行CMD
这个命令时,它的输出结果会替换掉 $( CMD )
。
例如,如果执行 for file in $(ls)
,shell首先将调用ls
,然后遍历通过 ls
得到的这些返回值。
进程替换(process substitution)
<( CMD )
会执行 CMD
并将结果输出到一个临时文件中,并将 <( CMD )
替换成临时文件名,这在我们希望返回值通过文件而不是STDIN传递时很有用
例如,由于 diff
接受文件形式的比较,我们可以使用 diff <(ls foo) <(ls bar)
会显示文件夹 foo
和 bar
中文件的区别。
#!/bin/bash
echo "Starting program at $(date)" # date会被替换成日期和时间
echo "Running program $0 with $# arguments with pid $$"
for file in "$@"; do
grep foobar "$file" > /dev/null 2> /dev/null
# 如果模式没有找到,则grep退出状态为 1
# 我们将标准输出流和标准错误流重定向到Null,因为我们并不关心这些信息
if [[ $? -ne 0 ]]; then
echo "File $file does not have any foobar, adding one"
echo "# foobar" >> "$file"
fi
done
通配
当执行脚本时,我们经常需要提供形式类似的参数。bash使我们可以轻松的实现这一操作,它可以基于文件扩展名展开表达式。这一技术被称为shell的 通配(globbing)
- 通配符 - 当你想要利用通配符进行匹配时,你可以分别使用
?
和*
来匹配一个或任意个字符。?
匹配 1 次任意字符*
匹配多次任意字符- 例如,对于文件
foo
,foo1
,foo2
,foo10
和bar
,rm foo?
这条命令会删除foo1
和foo2
,而rm foo*
则会删除除了bar
之外的所有文件。
- 花括号
{}
- 当你有一系列的指令,其中包含一段公共子串时,可以用花括号来自动展开这些命令。这在批量移动或转换文件时非常方便。{a,c}
表示a
,c
{a..c}
表示a
,b
,c
(按照数字、字母顺序)
混用的{?..?}
如果数字和字母混用,不会进行任何操作,返回的仍然是 {?..?}
convert image.{png,jpg}
# 会展开为
convert image.png image.jpg
# 学到了!!!非常方便!!!
cp /path/to/project/{foo,bar,baz}.sh /newpath
# 会展开为
cp /path/to/project/foo.sh /path/to/project/bar.sh /path/to/project/baz.sh /newpath
# 也可以结合通配使用
mv *{.py,.sh} folder
# 会移动所有 *.py 和 *.sh 文件
mkdir foo bar
# 下面命令会创建foo/a, foo/b, ... foo/h, bar/a, bar/b, ... bar/h这些文件
touch {foo,bar}/{a..h}
touch foo/x bar/y
# 比较文件夹 foo 和 bar 中包含文件的不同
diff <(ls foo) <(ls bar)
# 输出
# < x
# ---
# > y
编写 bash
脚本有时候会很别扭和反直觉。例如 shellcheck 这样的工具可以帮助你定位sh/bash脚本中的错误。
这里的 shebang 部分请参见 [[Missing.01 Shell#shebang
!
]]
shell函数和脚本有如下一些不同点:
- 函数只能与shell使用相同的语言,脚本可以使用任意语言。因此在脚本中包含
shebang
是很重要的。 - 函数仅在定义时被加载,脚本会在每次被执行时加载。这让函数的加载比脚本略快一些,但每次修改函数定义,都要重新加载一次。
- 函数会在当前的shell环境中执行,脚本会在单独的进程中执行。因此,函数可以对环境变量进行更改,比如改变当前工作目录,脚本则不行。脚本需要使用
export
将环境变量导出,并将值传递给环境变量。 - 与其他程序语言一样,函数可以提高代码模块性、代码复用性并创建清晰性的结构。shell脚本中往往也会包含它们自己的函数定义。
Shell 工具
查看帮助
- 命令行添加
-h
或--help
标记 man
tldr
/ tldr Pages- 某些交互式窗口:
:help
命令或键入?
/h
- ~~StackOverflow~~
- ~~ChatGPT~~
man
tldr
查找文件
find
常见选项
- -name
名称为(可用通配符)
- -path
路径(完整路径)
Eg. */test/*.py
- -mtime
修改时间
Eg. find /path/to/directory -mtime -7 # 查找最近7天内被修改过的文件
- -atime
访问时间
Eg. find /path/to/directory -atime +30 # 查找超过30天未被访问过的文件
- -exec
查找后操作
Eg. find . -name '*.tmp' -exec rm {} \; # 删除全部扩展名为.tmp 的文件
find . -name '*.png' -exec convert {} {}.jpg \; # 查找全部的 PNG 文件并将其转换为 JPG
尽管 find
用途广泛,它的语法却比较难以记忆。例如,为了查找满足包含 PATTERN
的文件,您需要执行 find -name '*PATTERN*'
(如果您希望模式匹配时是不区分大小写,可以使用-iname
选项)
fd
- 更简单、更快速、更友好
- 很多不错的默认设置,例如输出着色、默认支持正则匹配、支持unicode
- 语法符合直觉
locate
- 通过建立数据库的方式来实现更加快速地搜索
- 在大多数系统中
updatedb
都会通过cron
每日更新 - 只能通过文件名
- 基于数据库的搜索工具,可能无法实时反映文件系统中的最新更改
手动更新数据库
查找代码
grep
见 [[Missing.01 Shell#管道 输出的最后更改日期,grep]]
rg
(ripgrep)
# 查找所有使用了 requests 库的文件
rg -t py 'import requests'
# 查找所有没有写 shebang 的文件(包含隐藏文件)
rg -u --files-without-match "^#!"
# 查找所有的foo字符串,并打印其之后的5行
rg foo -A 5
# 打印匹配的统计信息(匹配的行和文件的数量)
rg --stats PATTERN
查找 shell 命令
history
history
会输出一系列 序号+命令的列表,可以配合 gerp
Ctrl
+ R
可以输入历史子串匹配
Ctrl
+ R
with fzf
fzf
是一个通用对模糊查找工具
使用 zsh
另外一个和历史命令相关的技巧我喜欢称之为基于历史的自动补全。 这一特性最初是由 fish shell 创建的,它可以根据您最近使用过的开头相同的命令,动态地对当前对shell命令进行补全。这一功能在 zsh 中也可以使用,它可以极大的提高用户体验。
你可以修改 shell history 的行为,例如,如果在命令的开头加上一个空格,它就不会被加进shell记录中。当你输入包含密码或是其他敏感信息的命令时会用到这一特性。 为此你需要在.bashrc
中添加HISTCONTROL=ignorespace
或者向.zshrc
添加 setopt HIST_IGNORE_SPACE
。 如果你不小心忘了在前面加空格,可以通过编辑。bash_history
或 .zhistory
来手动地从历史记录中移除那一项。
文件夹导航
- alias
ln -s
“快捷方式”fasd
autojump
fasd
/ autojump
Fasd 基于 frecency 对文件和文件排序,也就是说它会同时针对频率(frequency)和时效(recency)进行排序。默认情况下,fasd
使用命令 z
帮助我们快速切换到最常访问的目录。例如, 如果您经常访问/home/user/files/cool_project
目录,那么可以直接使用 z cool
跳转到该目录。对于 autojump,则使用j cool
代替即可。
课后练习
man ls
- -a, --all do not ignore entries starting with .
- -h, --human-readable with -l and -s, print sizes like 1K 234M 2G etc.
- -c with -lt: sort by, and show, ctime (time of last change of file status information); with -l: show ctime and sort by name; otherwise: sort by ctime, newest first
- --color[=_WHEN_]color the output WHEN; more info below
编写 bash 函数
macro.sh
polo.sh
你可以把代码写在单独的文件
marco.sh
中,并通过source marco.sh
命令,(重新)加载函数。
编写 bash 脚本
编写一段bash脚本,运行如下的脚本直到它出错,将它的标准输出和标准错误流记录到文件,并在最后输出所有内容。 加分项:报告脚本在失败前共运行了多少次。
#!/usr/bin/env bash
n=$(( RANDOM % 100 ))
if [[ n -eq 42 ]]; then
echo "Something went wrong"
>&2 echo "The error was using magic numbers"
exit 1
fi
echo "Everything went according to plan"
重定向与赋值
重定向
command > output.txt
:将命令的标准输出流重定向到文件output.txt
。command 2> error.txt
:将命令的标准错误流重定向到文件error.txt
。command > output.txt 2>&1
:将标准输出流和标准错误流均重定向到文件output.txt
。
赋值
在这个示例中,2>&1
将标准错误输出流重定向到标准输出流,并且 >/dev/null
将标准输出流重定向到 /dev/null
,这样标准输出就不会被捕获,只有标准错误被赋值给错误变量。
xarg
- 使用标准输入中的内容作为参数
例如,ls | xargs rm
会删除当前目录中的所有文件。
- -d, --delimiter=CHARACTER items in input stream are separated by CHARACTER, not by whitespace; disables quote and backslash processing and logical EOF processing
I. -print 0
使用空字符分割+-0
识别空字符
II. -d '\n'