切割合并文件在linux下用split和cat就可以完成。
其中split分为两种,二进制文件模式切割和文本文件模式切割。
split语法格式: split [OPTION] [INPUT [PREFIX]]
文本模式:
例如: split -C 4k sfile split
会将文件sfile按最大4k大小切割成splitaa, splitbb,...不破坏行.
split -l 50 sfile split
会将文件sfile按每50行切割成成小文件。
二进制模式:
split -b 4k sfile split
每个分块大小都是4k,最后一个除外。任何类型文件都可以用这种切割模式。
split选项:
- -a :指定前缀长度。例如
split -l 100 -a 3 sfile result 的输出结果为:resultaaa,resultaab,resultaac ...
- -b: 指定每个文件的大小,也就成了二进制模式,分割后的文件基本不可读。
- -d: 使用数字前缀而不是默认的字母前缀。
-
用-b或-C指定分块大小时,可用的单位有,b for 512bytes, k for 1Kbytes, m for 1 Megbytes
文件的合并:
cat result* > result
去掉重复的行:
cat result * | sort | uniq > result
阅读(1441) | 评论(0) | 转发(0) |