Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1332777
  • 博文数量: 185
  • 博客积分: 50
  • 博客等级: 民兵
  • 技术积分: 3934
  • 用 户 组: 普通用户
  • 注册时间: 2007-09-11 13:11
个人简介

iihero@ChinaUnix, ehero.[iihero] 数据库技术的痴迷爱好者. 您可以通过iihero AT qq.com联系到我 以下是我的三本图书: Sybase ASE in Action, Oracle Spatial及OCI高级编程, Java2网络协议内幕

文章分类

全部博文(185)

文章存档

2014年(4)

2013年(181)

分类: Python/Ruby

2013-07-18 09:53:14

sqlite(版本3),以下简称sqlite3,目前功能已经非常强大。目前支持的字符集,包括UTF-8, UTF-16,UTF-16le,UTF-16be。

可是在我们直接使用gbk编码的时候,很可能就会遇到问题。

因为目前,很多人会使用c/c++接口来访问sqlite3数据库,当然,也有人使用python接口来访问它。
1. 使用python时,要想正确的取到c++接口insert/update以后的数据,需要设定Connection的text_factory值为str, 
意思是直接使用原来存储时的encoding形式。

con=sqlite3.connect(r"e:/t/testsqlite3.db")
con.text_factory=str

2. 使用sqlite jdbc访问的时候,如果想正确的取到c接口insert/update以后的数据,必须进行转码。
不过,转码时很奇怪,居然是用到:

String.getBytes("ISO_8859_1"), "GBK")

看来,c接口存储到sqlite3里边的数据,默认都是ISO_8859_1格式的,除非在insert/update以前,将其转换成utf-8再进行入库操作。

目前,sqlite jdbc以及python默认的存储方式是将字符串转换成utf-8串,再进行入库,非常标准。它们自己的upsert操作,然后取出数据,不会有任何问题。这个在我的前一篇短文里也有详细的描述。

阅读(2142) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~