分类: Sybase
2008-03-14 13:25:08
本文主要讲述了Sybase数据库批量操作(BCP)的设计和实现,以及在开发过程中的关键点,为后续开发者提供了技术基础
关键词 Sybase 批量操作 BCP 设计 实现
一、前言
在项目研发过程中,需要开发一个数据库批量操作的动态链接库(DLL),以前的实现主要是程序中直接调用bcp.exe,这种方式由应用程序创建子进程,不好控制批量操作过程,失败跟踪难度比较大,因此想利用bcp.exe调用的函数来实现操作过程。本人通过分析bcp.exe程序,得到了批量操作的DB LIBRARY API函数,再查阅API函数的资料得以实现该动态链接库。
二、实现
批量操作动态链接库只实现了一个输出函数, 应用程序通过动态加载DLL,再获取函数地址,便可调用函数实现批量操作。
输出函数定义如下:LIBBCP_API BOOL BCP_Transfer_2(const char *task, const char *step, const char *config, long *copiedrow);在动态链接库中定义了两个类:CInteriorGlobal和CSYBBCP。CInteriorGlobal完成全局的初始化操作,CSYBBCP实现数据库的批量操作。
在调用Sybase数据库的DB LIBRARY API函数进行数据库的相关操作时,首先需要调用dbsetversion函数设置版本信息,这个函数只能调用一次,如果再次调用则会报错。而类CSYBBCP在BCP_Transfer_2函数中动态创建和释放,如果在CSYBBCP中直接调用dbsetversion会导致多次调用出错。因此需要采用一种机制让dbsetversion只能调用一次,这里使用了设计模式中的SingleTom模式,SingleTom模式就是确保实例唯一,本人利用该类仅做一次实例化操作来初始化Sybase客户端版本信息。
下面是CInteriorGlobal的定义:
class CInteriorGlobal { public: static CInteriorGlobal *Instance(); private: CInteriorGlobal(); private: static CInteriorGlobal *_instance; };CInteriorGlobal的实现,在构造函数中设置版本信息:
CInteriorGlobal::CInteriorGlobal() { dbsetversion(DBVERSION_100); } CInteriorGlobal *CInteriorGlobal::_instance = 0; CInteriorGlobal * CInteriorGlobal::Instance() { if(0 == _instance) _instance = new CInteriorGlobal; return _instance; }为了完成批量操作,定义类CSYBBCP,具体定义如下:
class CSYBBCP { public: CSYBBCP(); ~CSYBBCP(); BOOL DoConnect(int taskindex, int stepindex, char *server, char *database, char *username, char *password, char *charset, char *language); BOOL DoQuery(char *sql, char **buf, int *rowcount, int *fieldcount); BOOL DoUpdate(char *sql, char *database = NULL); BOOL BCP_Connect(int taskindex, int stepindex, char *server, char *database, char *username, char *password, char *charset, char *language); BOOL BCP_Transfer_db(char *sql, char *fldterminator, char *rowterminator, int direction, char *datafile, char *errfile, long *copiedrow); private: BOOL m_isbcpout; int m_stepindex; int m_taskindex; char m_viewname[MAX_STRING_NUM]; char m_database[MAX_STRING_NUM]; DBPROCESS *m_dbproc; private: int GetTableFieldNums(char *table); BOOL DoDisconnect(); };在类CSYBBCP中,主要是函数BCP_Transfer_db进行数据库大批量数据的导入和导出,要完成数据传输操作,需要如下几个步骤:
// 初始化:指定表明和数据文件 if(bcp_init(m_dbproc, tablename, datafile, NULL, direction) == FAIL) { return FALSE; } // 设置批量操作的控制参数,这里设置的每批记录数 if(bcp_control(m_dbproc, BCPBATCH, (DBINT) 1000) == FAIL) { return FALSE; } // 设置列数 if(bcp_columns(m_dbproc, cCols) == FAIL) { return FALSE; } // 设置列格式 for(ii = 1; ii < cCols; ii++) { if(bcp_colfmt(m_dbproc, ii, SYBCHAR, 0, -1, (UINT8 *) fldterminator, _strlen(fldterminator), ii) == FAIL) { return FALSE; } } if(bcp_colfmt(m_dbproc, ii, SYBCHAR, 0, -1, (UINT8 *) rowterminator, _strlen(rowterminator), ii) == FAIL) { return FALSE; } // 执行批量操作 while(bcp_exec(m_dbproc, & cRows) == FAIL) { return FALSE; } // 批量操作结束 retcode = bcp_done(m_dbproc);在使用Sybase12.5客户端之前,程序未调用bcp_control函数,在执行bcp_exec函数时不是使用while,而是使用if判断,代码如下:
if(bcp_exec(m_dbproc, & cRows) == FAIL) { return FALSE; }程序能正常完成功能,当使用Sybase12.5客户端后,在执行时发现程序突然退出,异常处理也未能记录日志,后跟踪发现程序是在执行bcp_exec时退出,但是未能查出原因,咨询Sybase公司技术人员,也没能解决问题。后来在一次测试中偶然发现有时能导入数据,于是测试数据文件在什么情况下能导入,实验其临界点,多次测试后发现文件1000条记录为临界点,超过则出现问题。于是本人在程序中调用bcp_control函数,设置批量记录为1000,如果数据文件记录多于1000,则需要bcp_exec执行多次才能完成,所以采用while,而不是if,这样问题解决。
三、结束
在上面的论述中,还仅仅涉及DB LIBRARY,对于Sybase客户端编程,还有CT LIBRARY方式,目前CT已经支持导出,但不支持导入。