数据文件加载进数据仓库,最麻烦的地方就是数据文件中数据发生错位。
例如,字段错位,记录错位。
为解决这个问题,有必要对数据文件的字段分隔符,记录分隔符进行合理的设置。
根据经验,选择特殊的,而且组合的字符集作为分隔符,会比较理想。
经过调研,sybase,informix,sql server均可以采用组合字符的方式提取数据。
其中sybase,sql server采用bcp方式下载文本,通过在format文件中规定好字符,即可
informix采用hpl方式下载文本,通过在format文件中规定好字符组合,即可。
oracle的数据采集,需要另外测试一下。
阅读(993) | 评论(0) | 转发(0) |