Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1366774
  • 博文数量: 243
  • 博客积分: 888
  • 博客等级: 准尉
  • 技术积分: 2955
  • 用 户 组: 普通用户
  • 注册时间: 2012-12-05 14:33
个人简介

漫漫长路,其修远兮!

文章分类

全部博文(243)

文章存档

2017年(2)

2016年(22)

2015年(32)

2014年(57)

2013年(107)

2012年(23)

分类: Mysql/postgreSQL

2013-10-31 13:54:28

如果大家用到INFOBRIGHT,对这个字眼就不陌生了。 
 
目前有4种格式。
1. binary.
2. txt_variable
3. mysql
4. infobright
 
代表什么意思呢,我来详细解释下。
BINARY 代表二进制数据。 也就是说,原始数据是以特定格式的二进制来保存。 具体格式,可以参见官方的白皮书,很容易下载到。
 
TXT_VARIABLE 代表 CSV格式文本。默认的列分隔符为“;”。 
 
MYSQL 代表和MYSQL兼容的CSV格式文本。默认分隔符为“水平制表符“。
 
INFOBRIGHT 呢,代表分布式导入工具(DLP)生成的中间结果集, 只能用来导入DLP的中间数据。
 
这几种格式的载入速度按照以下顺序,由高到低排列:
INFOBRIGHT   --->   BINARY ---> TXT_VARIABLE ---> MYSQL。
可以看到MYSQL载入最慢。 但是MYSQL能打印出来更多的错误信息以供调试。
 
设置方法:
set @bh_dataformat = '随便一种';
即可。
阅读(1938) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~