Chinaunix首页 | 论坛 | 博客
  • 博客访问: 38887
  • 博文数量: 19
  • 博客积分: 850
  • 博客等级: 准尉
  • 技术积分: 220
  • 用 户 组: 普通用户
  • 注册时间: 2005-11-18 00:03
文章分类

全部博文(19)

文章存档

2010年(1)

2009年(17)

2008年(1)

我的朋友
最近访客

分类: DB2/Informix

2009-09-03 10:58:46

 informix 从文本导入海量数据(informix load)

从文本导入数据到informix数据一般使用SQL语句:
load from file.dat insert into tablename;
但当导入的数据有好几百万甚至上千万条时用上面的方法产生大锁表,及至数据库锁不够,导致长事务无法导入。
一个解决的办法是使用dbload命令,以下为dbload的参数说明:
#---------------------------------------------------------------------
#dbload Usage:
#
#dbload [-d dbname] [-c cfilname] [-l logfile] [-e errnum] [-n nnum]
#    [-i inum] [-s] [-p] [-r | -k] [-X]
#
#    -d    database name
#    -c    command file name
#    -l    bad row(s) log file
#    -e    bad row(s) # before abort
#    -s    syntax error check only
#    -n    # of row(s) before commit
#    -p    prompt to commit or not on abort
#    -i    # or row(s) to ignore before starting
#    -r    loading without locking table
#    -X    recognize HEX escapes in character fields
#    -k      loading with exclusive lock on table(s)
#---------------------------------------------------------------------

下面举一简单例子:
数据库名:dbsname
load命令文件名:load.sh
错误日志文件名:error.log
每次提交的数据条数:100000

数据文件名:loadfile.txt
数据字段分隔符: “|”
每行数据的字段数据: 14
要插入的数据表名:prepay

应用命令如下:
dbload -d DBNAME -c load.sh -l error.log -n 100000;

load.sh 文件内容:
-----------------
file "loadfile.txt" delimiter "|" 14 ;
insert into tablename;
-----------------

附shell脚本:
---------------------------------------------------------------------------------
#!/bin/ksh
#===========================================================================
#filename:dbload.sh
#功能:
#从文件导入海量数据到informix数据库中
#主要是解决海量数据导入问题,当直接使用形如:
#load from loadfile.txt insert into tablename;
#导入数据时,如果数据超过几百万条则会使缓存被充满而无法导入
#input: nameDB nameTable dataFile
#注意:
#1.程序需要informix load 支持
#2.数据文件第行应以"|"结尾
#===========================================================================

#参数输入
if [ $# -ne 3 ];then
cat << EOF
Usage: $0 nameDB nameTable dataFile

   nameDB       数据库名
   nameTable   数据库表名
   dataFile     即将导入数据库的数据文件
EOF
exit 1
fi

nameDB="$1" #数据库名
nameTable="$2" #数据库表名
dataFile="$3" #即将导入数据库的数据文件

if [ ! -f "$dataFile" ];then
echo "数据文件[$dataFile]不存在!" | tee -a $errLog
exit 1
fi

tmpStr0=`echo $dataFile | sed "s/\//_/g"`
errLog="${tmpStr0}_E.log" #日志
:>$errLog

delimStr="|" #数据文件中数据分隔符
commitNum=100000 #一次提交的数据条数

loadCMDFile="load$$.cmd" #load命令文件

tmpFile="`basename $dataFile`.tmp" #临时文件


trap "myExit" 0 1 2 3 9 11 15

myExit()
{

#程序退出前删除临时文件
#删除load命令文件
rm -f $loadCMDFile
rm -f $tmpFile

#如果日志文件是空的删除
if [ ! -f "$errLog" ];then
  return
fi
_tmpNum="`cat $errLog | wc -c`"
_tmpNum="`expr $_tmpNum`"
if [ $_tmpNum -eq 0 ];then
   rm -f $errLog
fi
}

lineNum="`cat $dataFile | wc -l`" #数据行数
lineNum="`expr $lineNum`"
if [ $lineNum -eq 0 ];then
echo "数据文件[$dataFile]是空的!" | tee -a $errLog
exit 1
fi

#数据文件数据列数
colNum=`head -n1 $dataFile | awk -F"|" '{print NF}'`
#数据文件中的数据行最后有一个"|"
colNum=`expr $colNum - 1`


cat << EOF > $loadCMDFile
file "$dataFile" delimiter "$delimStr" $colNum;
insert into $nameTable;
EOF

if [ ! -f "$loadCMDFile" ];then
echo "load命令文件[$loadCMDFile]不存在!" | tee -a $errLog
exit 1
fi
:> $tmpFile

dbload -d $nameDB -c $loadCMDFile -l $errLog -n $commitNum >> $tmpFile 2>&1
#| tee -a $tmpFile 2>&1
#cat $tmpFile

echo "[提示]数据文件行数: $lineNum"

#获取导入的数据条数
grepStr="Table $nameTable had "
tmpStr=`grep "$grepStr" $tmpFile`
insertNum=0
if [ "$tmpStr" != "" ];then
for str in $tmpStr
do
  tmpStr2=`echo $str | grep "^[0-9]*$"`
  if [ "$tmpStr2" = "" ];then
   continue
  else
   insertNum=`expr $str`
   echo "[提示]总计导入条数: $insertNum"
   errNum=` expr $lineNum - $insertNum `
   if [ $errNum -gt 0 ];then
    echo "[ERROR]导入失败条数: $errNum"
    exit 1
   else
    echo "[OK]导入成功!"
   fi
   break
  fi
done
else
echo "[ERROR]导入失败条数: $lineNum"
exit 1
fi

阅读(623) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~