Chinaunix首页 | 论坛 | 博客
  • 博客访问: 7218518
  • 博文数量: 3857
  • 博客积分: 6409
  • 博客等级: 准将
  • 技术积分: 15948
  • 用 户 组: 普通用户
  • 注册时间: 2008-09-02 16:48
个人简介

迷彩 潜伏 隐蔽 伪装

文章分类

全部博文(3857)

文章存档

2017年(5)

2016年(63)

2015年(927)

2014年(677)

2013年(807)

2012年(1241)

2011年(67)

2010年(7)

2009年(36)

2008年(28)

分类: LINUX

2015-06-30 08:16:20

Linux命令行艺术

[日期:2015-06-29] 来源:Linux中国  作者:Linux [字体:  ]

curl -s '' | egrep -o '`\w+`' | tr -d '`' | cowsay -W50

流畅地使用命令行是一个常被忽略的技能,或被认为是神秘的奥义。但是,它会以明显而微妙的方式改善你作为工程师的灵活度和生产力。这是我在 Linux 上工作时发现的有用的命令行使用小窍门和笔记的精粹。有些小窍门是很基础的,而有些是相当地特别、复杂、或者晦涩难懂。这篇文章不长,但是如果你可以使用并记得这里的所有内容,那么你就懂得很多了。

其中大部分最初出现Quora上,但是考虑到兴趣所在,似乎更应该放到 Github 上,这里的人比我更能提出改进建议。如果你看到一个错误,或者更好的某种东西,请提交问题或 PR!(当然,提交前请看看必读小节和已有的 PR/Issue。)

 

必读

范围:

  • 本文是针对初学者和专业人员的,选题目标是覆盖面广(全都很重要)、有针对性(大多数情况下都给出具体实例)而简洁(避免不必要内容以及你能在其它地方轻松找到的离题的内容)。每个小窍门在某种情形下都很必需的,或者能比替代品大大节省时间。
  • 这是为 Linux 写的。绝大部分条目都可以同样应用到 MacOS(或者甚至 Cygwin)。
  • 主要针对交互式 Bash,尽管大多数小窍门也可以应用到其它 shell,以及常规 Bash 脚本。
  • 包括了“标准的”UNIX 命令以及那些需要安装的软件包(它们很重要,值得安装)。

注意:

  • 为了能在一篇文章内展示尽量多的东西,一些具体的信息会被放到引用页里。你可以使用 Google 来获得进一步的内容。(如果需要的话,)你可以使用 apt-get/yum/dnf/pacman/pip/brew 来安装这些新的程序。
  • 使用 Explainshell 来获取命令、参数、管道等内容的解释。

 

基础

  • 学习基本 Bash 技能。实际上,键入man bash,然后至少浏览一遍所有内容;它很容易理解,没那么长。其它 shell 也不错,但是 Bash 很强大,而且到处都可以找到(如果在你自己的笔记本上学习 zsh、fish 之类,会在很多情形下受到限制,比如使用现存的服务器时)。

  • 至少学好一种基于文本的编辑器。理想的一个是 Vim(vi),因为在终端中编辑时随时都能找到它(即使大多数时候你在使用 Emacs、一个大型的 IDE、或一个现代的时髦编辑器)。

  • 学习怎样使用 man 来阅读文档(好奇的话,用 man man 来列出分区号,比如 1 是常规命令,5 是文件描述,8 用于管理员)。用 apropos 找到帮助页。了解哪些命令不是可执行程序,而是 Bash 内置的,你可以用 help 和 help -d 得到帮助。

  • 学习使用 > 和 < 来进行输出和输入重定向,以及使用 | 来管道重定向,学习关于 stdout 和 stderr 的东西。

  • 学习 *(也许还有 ? 和 {...} )文件通配扩展和应用,以及双引号 " 和单引号 ' 之间的区别。(更多内容请参看下面关于变量扩展部分)。

  • 熟悉 Bash 作业管理:&, ctrl-z, ctrl-c, jobs, fg, bg, kill 等等。

  • 掌握ssh,以及通过 ssh-agentssh-add 等进行无密码验证的基础技能。

  • 基本的文件管理:ls 和 ls -l(特别是,知道ls -l各个列的意义),less, head, tail 和 tail -f(或者更好的less +F),ln 和 ln -s(知道硬链接和软链接的区别,以及硬链接相对于软链接的优势),chownchmoddu(用于查看磁盘使用率的快速摘要:du -sk *)。文件系统管理:df, mountfdiskmkfslsblk

  • 基本的网络管理: ip 或 ifconfigdig

  • 熟知正则表达式,以及各种使用grep/egrep的选项。-i-o-A 和 -B 选项值得掌握。

  • 学会使用 apt-getyum ,dnf 或 pacman(这取决于你的发行版)来查找并安装软件包。确保你可以用 pip 来安装基于 Python 的命令行工具(下面的一些东西可以很容易地通过 pip 安装)。

 

日常使用

 

处理文件和数据

  • 要在当前目录中按名称定位文件,find . -iname '*something*'(或者相类似的)。要按名称查找任何地方的文件,使用 locate something(但请记住,updatedb 可能还没有索引最近创建的文件)。

  • 对于源代码或数据文件进行的常规搜索(要比 grep -r 更高级),使用 ag

  • 要将 HTML 转成文本:lynx -dump -stdin

  • 对于 Markdown、HTML,以及各种类型的文档转换,可以试试 pandoc

  • 如果你必须处理 XML,xmlstarlet 虽然有点老旧,但是很好用。

  • 对于 JSON,使用jq

  • 对于 Excel 或 CSV 文件,csvkit 提供了 in2csvcsvcutcsvjoincsvgrep 等工具。

  • 对于亚马逊 S3 ,s3cmd 会很方便,而 s4cmd 则更快速。亚马逊的 aws 则是其它 AWS 相关任务的必备。

  • 掌握 sort 和 uniq,包括 uniq 的 -u 和 -d 选项——参见下面的单行程序。

  • 掌握 cutpaste 和 join,它们用于处理文本文件。很多人会使用 cut,但常常忘了 join

  • 了解 tee,它会将 stdin 同时复制到一个文件和 stdout,如 ls -al | tee file.txt

  • 知道 locale 会以微妙的方式对命令行工具产生大量的影响,包括排序的顺序(整理)以及性能。大多数安装好的 Linux 会设置 LANG 或其它 locale 环境变量为本地设置,比如像 US English。但是,你要明白,如果改变了本地环境,那么排序也将改变。而且 i18n 过程会让排序或其它命令的运行慢好多倍。在某些情形中(如像下面那样的设置操作或唯一性操作),你可以安全地整个忽略缓慢的 i18n 过程,然后使用传统的基于字节的排序顺序 export LC_ALL=C

  • 了解基本的改动数据的 awk 和 sed 技能。例如,计算某个文本文件第三列所有数字的和:awk '{ x += $3 } END { print x }'。这可能比 Python 的同等操作要快3倍,而且要短3倍。

  • 在一个或多个文件中,替换所有出现在特定地方的某个字符串:

    1. perl -pi.bak -'s/old-string/new-string/g'my-files-*.txt
  • 要立即根据某个模式对大量文件重命名,使用 rename。对于复杂的重命名,repren 可以帮助你达成。

    1. # 恢复备份文件 foo.bak -> foo:
    2. rename 's/\.bak$//'*.bak
    3. # 完整的文件名、目录名 foo -> bar:
    4. repren --full --preserve-case--from foo --to bar .
  • 使用 shuf 来从某个文件中打乱或随机选择行。

  • 了解 sort 的选项。知道这些键是怎么工作的(-t-k)。特别是,注意你需要写-k1,1来只通过第一个字段排序;-k1意味着根据整行排序。

  • 稳定排序(sort -s)会很有用。例如,要首先按字段2排序,然后再按字段1排序,你可以使用sort -k1,1 | sort -s -k2,2

  • 如果你曾经需要在 Bash 命令行中写一个水平制表符(如,用于 -t 参数的排序),按ctrl-v [Tab],或者写$'\t'(后面的更好,因为你可以复制/粘贴)。

  • 对源代码进行补丁的标准工具是 diff 和 patch。 用 diffstat 来统计 diff 情况。注意 diff -r可以用于整个目录,所以可以用 diff -r tree1 tree2 | diffstat 来统计(两个目录的)差异。

  • 对于二进制文件,使用 hd 进行简单十六进制转储,以及 bvi 用于二进制编辑。

  • 还是用于二进制文件,strings(加上 grep 等)可以让你找出一点文本。

  • 对于二进制文件的差异(delta 压缩),可以使用 xdelta3

  • 要转换文本编码,试试 iconv 吧,或者对于更高级的用途使用 uconv;它支持一些高级的 Unicode 的东西。例如,这个命令可以转换为小写并移除所有重音符号(通过扩展和丢弃):

    1. uconv -f utf-8-t utf-8-'::Any-Lower; ::Any-NFD; [:Nonspacing Mark:] >; ::Any-NFC; '< input.txt > output.txt
  • 要将文件分割成几个部分,来看看 split(按大小分割)和 csplit(按格式分割)吧。

  • 使用 zlesszmorezcat 和 zgrep 来操作压缩文件。

 

系统调试

  • 对于 Web 调试,curl 和 curl -I 很方便灵活,或者也可以使用它们的同行 wget,或者更现代的httpie

  • 要了解磁盘、CPU、网络的状态,使用 iostatnetstattop(或更好的 htop)和(特别是)dstat。它们对于快速获知系统中发生的状况很好用。

  • 对于更深层次的系统总览,可以使用 glances。它会在一个终端窗口中为你呈现几个系统层次的统计数据,对于快速检查各个子系统很有帮助。

  • 要了解内存状态,可以运行 free 和 vmstat,看懂它们的输出结果吧。特别是,要知道“cached”值是Linux内核为文件缓存所占有的内存,因此,要有效地统计“free”值。

  • Java 系统调试是一件截然不同的事,但是对于 Oracle 系统以及其它一些 JVM 而言,不过是一个简单的小把戏,你可以运行 kill -3 <pid>,然后一个完整的堆栈追踪和内存堆的摘要(包括常规的垃圾收集细节,这很有用)将被转储到stderr/logs。

  • 使用 mtr 作路由追踪更好,可以识别网络问题。

  • 对于查看磁盘满载的原因,ncdu 会比常规命令如 du -sh * 更节省时间。

  • 要查找占用带宽的套接字和进程,试试 iftop 或 nethogs 吧。

  • (Apache附带的)ab工具对于临时应急检查网络服务器性能很有帮助。对于更复杂的负载测试,可以试试 siege

  • 对于更仔细的网络调试,可以用 wiresharktshark 或 ngrep

  • 掌握 strace 和 ltrace。如果某个程序失败、挂起或崩溃,而你又不知道原因,或者如果你想要获得性能的大概信息,这些工具会很有帮助。注意,分析选项(-c)和使用 -p 关联运行进程。

  • 掌握 ldd 来查看共享库等。

  • 知道如何使用 gdb 来连接到一个运行着的进程并获取其堆栈追踪信息。

  • 使用 /proc。当调试当前的问题时,它有时候出奇地有帮助。样例:/proc/cpuinfo/proc/xxx/cwd/proc/xxx/exe/proc/xxx/fd//proc/xxx/smaps

  • 当调试过去某个东西为何出错时,sar 会非常有帮助。它显示了 CPU、内存、网络等的历史统计数据。

  • 对于更深层的系统和性能分析,看看 stap (SystemTap),perf) 和 sysdig 吧。

  • 确认是正在使用的 Linux 发行版版本(支持大多数发行版):lsb_release -a

  • 每当某个东西的行为异常时(可能是硬件或者驱动器问题),使用dmesg

 

单行程序

这是将命令连成一行的一些样例:

  • 有时候通过 sort/uniq 对文本文件做交集、并集和差集运算时,这个例子会相当有帮助。假定 a和 b 是已经进行了唯一性处理的文本文件。这会很快,而且可以处理任意大小的文件,总计可达数千兆字节。(Sort不受内存限制,不过如果 /tmp 放在一个很小的根分区的话,你可能需要使用 -T 选项。)也可参见上面关于LC_ALL的注解和 -u 选项(参见下面例子更清晰)。
    1. sh cat a b | sort | uniq > c # c 是 a 和 b 的并集
    2. cat a b | sort | uniq -> c # c 是 a 和 b 的交集
    3. cat a b b | sort | uniq -> c # c 是 a 减去 b 的差集
  • 使用 grep . * 来可视化查看一个目录中的所有文件的所有内容,例如,对于放满配置文件的目录: /sys, /proc, /etc

  • 对某个文本文件的第三列中所有数据进行求和(该例子可能比同等功能的Python要快3倍,而且代码也少于其3倍):

    1. awk '{ x += $3 } END { print x }' myfile
  • 如果想要查看某个文件树的大小/日期,该例子就像一个递归ls -l,但是比ls -lR要更容易读懂:

    1. find .-type f -ls
  • 只要可以,请使用 xargs 或 parallel。注意,你可以控制每行(-L)执行多少个项目,以及并行执行(-P)。如果你不确定它是否会做正确的事情,可以首先使用 xargs echo。同时,使用 -I{} 也很方便。样例:

    1. find .-name '*.py'| xargs grep some_function
    2. cat hosts | xargs -I{} ssh root@{} hostname
  • 比如说,你有一个文本文件,如 Web 服务器的日志,在某些行中出现了某个特定的值,如 URL 中出现的 acct_id 参数。如果你想要统计有多少个 acct_id 的请求:

    1. cat access.log | egrep -'acct_id=[0-9]+'| cut -d=-f2 | sort | uniq -| sort-rn
  • 运行该函数来获得来自本文的随机提示(解析Markdown并从中提取某个项目):

    1. function taocl(){
    2. curl -s https://raw.githubusercontent.com/jlevy/the-art-of-command-line/master/README.md |
    3. pandoc -f markdown -t html |
    4. xmlstarlet fo --html --dropdtd |
    5. xmlstarlet sel --"(html/body/ul/li[count(p)>0])[$RANDOM mod last()+1]"|
    6. xmlstarlet unesc | fmt -80
    7. }

 

晦涩难懂,但却有用

  • expr:实施算术或布林操作,或者求正则表达式的值

  • m4:简单的宏处理器

  • yes:大量打印一个字符串

  • cal:漂亮的日历

  • env:(以特定的环境变量设置)运行一个命令(脚本中很有用)

  • look:查找以某个字符串开头的英文单词(或文件中的行)

  • cut 和 paste 以及 join:数据处理

  • fmt:格式化文本段落

  • pr:格式化文本为页/列

  • fold:文本折行

  • column:格式化文本为列或表

  • expand 和 unexpand:在制表符和空格间转换

  • nl:添加行号

  • seq:打印数字

  • bc:计算器

  • factor:分解质因子

  • gpg:加密并为文件签名

  • toe:terminfo 条目表

  • nc:网络调试和数据传输

  • socat:套接字中继和 tcp 端口转发(类似 netcat

  • slurm:网络流量可视化

  • dd:在文件或设备间移动数据

  • file:识别文件类型

  • tree:以树形显示目录及子目录;类似 ls,但是是递归的。

  • stat:文件信息

  • tac:逆序打印文件

  • shuf:从文件中随机选择行

  • comm:逐行对比分类排序的文件

  • hdbvi:转储或编辑二进制文件

  • strings:从二进制文件提取文本

  • tr:字符转译或处理

  • iconvuconv:文本编码转换

  • splitcsplit:分割文件

  • units:单位转换和计算;将每双周(fortnigh)一浪(浪,furlong,长度单位,约201米)转换为每瞬(blink)一缇(缇,twip,一种和屏幕无关的长度单位)(参见: /usr/share/units/definitions.units)(LCTT 译注:这都是神马单位啊!)

  • 7z:高比率文件压缩

  • ldd:动态库信息

  • nm:目标文件的符号

  • ab:Web 服务器基准测试

  • strace:系统调用调试

  • mtr:用于网络调试的更好的路由追踪软件

  • cssh:可视化并发 shell

  • rsync:通过 SSH 同步文件和文件夹

  • wireshark 和 tshark:抓包和网络调试

  • ngrep:从网络层摘取信息

  • host 和 dig:DNS查询

  • lsof:处理文件描述符和套接字信息

  • dstat:有用的系统统计数据

  • glances:高级,多个子系统概览

  • iostat:CPU和磁盘使用率统计

  • htop:top的改进版

  • last:登录历史

  • w:谁登录进来了

  • id:用户/组身份信息

  • sar:历史系统统计数据

  • iftopnethogs:按套接口或进程的网络使用率

  • ss:套接口统计数据

  • dmesg:启动和系统错误信息

  • hdparm:SATA/ATA 磁盘操作/改善性能

  • lsb_release:Linux 发行版信息

  • lsblk:列出块设备,以树形展示你的磁盘和分区

  • lshw:硬件信息

  • fortuneddate 和 sl:嗯,好吧,它取决于你是否认为蒸汽机车和 Zippy 引用“有用”

 

更多资源

 

免责声明

除了非常小的任务外,其它都写出了代码供大家阅读。伴随力量而来的是责任。事实是,你在Bash中做的,并不意味着是你所应该做的!;)


via: 

作者:jlevy 译者:GOLinux 校对:wxy

本文由 LCTT 原创翻译,Linux中国 荣誉推出

本文永久更新链接地址

阅读(1228) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~