cut命令-u0402-ChinaUnix博客

u0402

首页　| 　博文目录　| 　关于我

u0402

博客访问： 832838
博文数量： 274
博客积分： 0
博客等级：民兵
技术积分： 862
用户组：普通用户
注册时间： 2015-10-24 15:31

个人简介

不合格的程序猿

文章分类

全部博文（274）

存储（24）
协议（1）

http（0）

tcp/ip（1）
设计模式（1）
算法（5）

加密算法（5）

排序算法（0）
虚拟化（1）

NFV（1）
office（0）

excel（0）

word（0）
linux开发工具（17）

io工具（1）

git（2）

svn（1）

ctags（0）

gdb（4）

gtags（0）

vim（1）
web服务器（7）

nginx（0）

apache（7）
语言c/c++/java（31）

java（0）

c++（3）

c语言（28）
vmware（2）
网络安全（23）

openssl（8）
Linux系统（108）

时间管理（0）

进程调度（0）

虚拟文件系统（3）

内存管理（2）
VPN（0）
脚本（37）

PHP（1）

Python（5）

shell（30）
SourceInsight（1）
ldap（16）
未分配的博文（0）

文章存档

2019年（3）

2018年（1）

2017年（4）

2016年（160）

2015年（106）

我的朋友

txgc_wm

相关博文

cut命令

分类： LINUX

2015-10-24 18:00:41

cut命令可以从一个文本文件或者文本流中提取文本列。

命令用法：

cut -b list [-n] [file ...]

cut -c list [file ...]

cut -f list [-d delim][-s][file ...]

l 上面的-b、-c、-f分别表示字节、字符、字段（即byte、character、field）；

l list表示-b、-c、-f操作范围，-n常常表示具体数字；

l file表示的自然是要操作的文本文件的名称；

l delim（英文全写：delimiter）表示分隔符，默认情况下为TAB；

l -s表示不包括那些不含分隔符的行（这样有利于去掉注释和标题）

上面三种方式中，表示从指定的范围中提取字节（-b）、或字符（-c）、或字段（-f）。

范围的表示方法：

N
只有第N项
N-
从第N项一直到行尾
N-M
从第N项到第M项(包括M)
-M
从一行的开始到第M项(包括M)
-
从一行的开始到结束的所有项

下面是实例，先以较简单的“命令用法”中提及的第二条开始讲起：

interrupts文件中的字符排列非常齐整，正适合我们切豆腐。

但这里我们只对两个数字列感兴趣，用法如下：

里面还有一些不需要的内容，精减一下：

合到一起：

哇，果然够帅!!

不相邻列的截选又应该如何做呢？

这种方式需要事先确定占多少个字符位置，不仅麻烦，而且容易出错。

下面的问题该怎么去做？

这就是第二讲：使用cut –f提取文本中的字段。

cut –c主要是用来在固定字符位置或个数的文本文件中提取，对于上面的例子就显得无能为力了。仔细观察，发现passwd文件有个规律，就是以冒号来区分不同的段的文本，于是。。。

怎么样，好玩吧~!

继续，创建一个文本文件，名为a.txt，名字有点土，凑合着用吧。

A1、B1、C1所代表的行字符之间均以TAB分隔，D1却是以空格来分开的。

看到-s的作用了吗？(因为第一行不含有任何TAB字符，所以直接被剔除了)，而最后一行(即D1行)，是以空格区分间距，所以也不合要求。

多了个参数，这个我没讲，只要你的智商比范伟高一点点，就肯定能猜出来啦。^_^

好了，下面是最后一个用法的讲解了：

因为虚拟终端下无法显示汉字，所以我只好回到图形下，截图就成这个白不垃圾的样子啦，忍忍吧，就快讲完了。

在这个文件中，每个汉字都是用半角空格分隔的。

用cut –c已经成功了，下面试试cut –b怎么样？

没有反应，why？

原因在于汉字本身是双字节的，cut –c把汉字“我”当成一个字符来处理，而cut –b是以字节来处理，把“我”拆成了两个字节，结果是字符被“切成两半”，因此无法正常显示。

原因找到了，要怎么办才好呢？

it's ok!

参考至：http://www.cublog.cn/u2/76835/showart_2013601.html

阅读(652) | 评论(0) | 转发(0) |

上一篇：strings 命令

下一篇：为什么 Linux 不需要碎片整理

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6