工具: 、 、 、
cut 、 、 。
sort
一般格式:sort -cmu -o output_file [other options] +pos1 +pos2 input_files
参数简介:
-c 测试文件是否已经分类
-m 合并两个分类文件,注意用到的文件是要分类好的
-u 删除所有复制行
-o 存储sort结果的输出文件名
其他选项有:(注其他选项要连在一起,如-k4nr)
-b 使用域进行分类时,忽略第一个空格。
-n 指定分类是域上的数字分类。
-t 域分隔符;用非空格或t a b键分隔域。
-r 对分类次序或比较求逆。
-k 指定域号,从1开始;如果是数值域的话后面需加n。
uniq
用途:用来从一个文本文件中去除或禁止重复行。
命令格式:uniq -udc -f input-file output-file
选项含义
-u 只显示不重复行
-d 只显示有重复数据行,每种重复行只显示其中一行
-c 打印每一重复行出行次数
-f n n为数字,前n个域被忽略,如不识别-f选项,则使用-n。
join
用途:将来自两个分类文本文件的行连在一起。
命令格式:join [options] input-file1 input-file2
选项含义
-a n n为数字,用于连接时从文件n中显示不匹配行
-o n,m n为文件号,m为域号。用于显示文件n第m域
-j n m n为文件号,m为域号。使用其他域做连接域
-t 域分隔符
cut
用途:用来从标准输入或文本文件中剪切列或域
命令格式:cut [options] file1 file2
选项含义
-c list 指定剪切字符数
-f field 指定剪切域数
-d 指定与空格和tab键不同的域分隔符
paste
用途:可以将cut剪切的数据粘贴起来形成相关文件
命令格式: paste -d -s -file1 file2
选项含义
-d 指定不同于空格或tab键的域分隔符。
-s 将每个文件合并成行而不是按行粘贴。
- 标准输入,列数。
split
用途:将大文件分割成小文件。
命令格式: spilt -output_file-size input_filename output_filename
阅读(1781) | 评论(0) | 转发(0) |