文件切割-chengxiaopeng-ChinaUnix博客

厚德载物peng.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

chengxiaopeng

博客访问： 2565920
博文数量： 308
博客积分： 5547
博客等级：大校
技术积分： 3782
用户组：普通用户
注册时间： 2009-11-24 09:47

个人简介

hello world.

文章分类

全部博文（308）

CodeBuilder系列（0）
QT（8）
工作笔记（51）
计算机科学与技术（1）

汇编语言（0）

离散数学（1）
C/C++程序设计（147）

C语言趣味程序百（11）

C++程序设计（30）
系统架构（1）
数据结构（8）

串（1）

队列（2）

栈（2）

链式存储结构（1）

线性表（1）
Linux&Unix（21）

Shell编程（4）

其它（13）

Linux环境下C编程（3）

网络编程（1）
算法（67）

贪心算法（1）

分治法（1）

穷举法（1）

算法练习（1）

妙趣横生的算法（57）
心情故事（1）
未分配的博文（3）

相关博文

文件切割

分类： LINUX

2014-06-25 11:31:54

局方分配了一个任务，需要对30多万的数据，核查失败原因。而局方提供的号码是一个文本文件。用过Oracle数据库的人，都知道，使用PL/SQL Developer开发工具，打开一个SQL Windows ,写个带rowid的查询语句如：select a.*,rowid from cxp_xuanling_error a;然后点开小锁按钮，将数据复制，粘贴到里面。当然了，如果数据量小，没啥问题。可当数据量多的时候，这样做会非常慢。
我首先想到的，就是先把文件进行切割，因为数据量大，不好加载。上网搜索，解决办法还真不少。文件切割的文章有很多，终于发现比较适合我的，我采用了，采用SHELL程序，进行对文件的切割。比如每5万行，进行文件切割， SHELL代码如下：

点击(此处)折叠或打开

#!/bin/sh
name=$1
lines=`wc -l $name|awk '{print $1}'`
filename="_disk"
index=0
count=1
app=50000
while [ $count -lt $lines ]
do
end=`expr $count - 1 + $app`
sed -n "$count,${end}p" $name > $name${filename}${index}
count=`expr $count + $app`
index=`expr $index + 1`
done

执行这个Shell脚本，后面添加一个文件名即可。
把文件切割为小文件后，接下来的一部就是，将提供的数据，变成一个添加的sql语句。这一步可以使用工具，不过自己比较钟爱使用awk。
比如说，我想在每5000行处sql语句追加commit;进行数据的提交。那么用awk，将简单方便，使用如下awk语句：
awk -F " " '{if(NR%5000==0){print "insert into cxp_xuanling_error_base(serial_number) values('\''"$1"'\''); \r\ncommit;"} else{print "insert into cxp_xuanling_error_base(serial_number) values('\''"$1"'\'');"}}' xuanling_error_all.txt_disk0 > xuanling_error_all.txt_disk0.sql
将生成的文件，重新写入到xuanling_error_all.txt_disk0.sql文件中。
生成了SQL语句，下面就好操作了，登陆sqlplus，执行这个语句即可。

SplitFile.rar

阅读(3308) | 评论(0) | 转发(0) |

上一篇：Oracle上使用spool,将表的数据做成数据文件

下一篇：SqlServer数据库，并发运行，获取唯一流水号

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6