Chinaunix首页 | 论坛 | 博客
  • 博客访问: 123952
  • 博文数量: 83
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 585
  • 用 户 组: 普通用户
  • 注册时间: 2014-05-13 10:26
个人简介

- 毅力与勇气是事业的双飞翼; - 在尝试中成长,在失败中奋起。 - 概览 -> 细读 -> 概览 - 书不在多,在于精。

文章分类

全部博文(83)

文章存档

2016年(2)

2015年(6)

2014年(75)

我的朋友

分类: LINUX

2014-06-09 11:19:33

转自: http://blog.csdn.net/qmhball/article/details/7917033

有个文件要处理,因为很大,所以想把它切成若干份,每份N行,以便并行处理。怎么搞呢?查了下强大的shell,果然有现成的工具--split
下面记录下基本用法:

[plain] view plaincopy

  1. split [-bl] file [prefix]  


参数说明:

-b, --bytes=SIZE:对file进行切分,每个小文件大小为SIZE。可以指定单位b,k,m
-l, --lines=NUMBER:对file进行切分,每个文件有NUMBER行。

prefix:分割后产生的文件名前缀。


示例:

假设要切分的文件为test.2012-08-16_17,大小1.2M12081行。

1)

[plain] view plaincopy

  1. split -l 5000 test.2012-08-16_17  

生成xaaxabxac三个文件。
wc -l 看到三个文件行数如下:
5000 xaa
5000 xab
2081 xac

12081 总计


2)

[plain] view plaincopy

  1. split -b 600k test.2012-08-16_17  

生成xaaxab两个文件
ls -lh 看到 两个文件大小如下:
600K xaa

554K xab


3)

[plain] view plaincopy

  1. split -b 500k test.2012-08-16_17 example  

得到三个文件,文件名的前缀都是example
ls -lh 看到文件信息如下:
500K exampleaa
500K exampleab
154K exampleac

阅读(672) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~