sqlite3 jdbc、c接口、python接口处理中文时遇到的问题及其解决方法-ehero-ChinaUnix博客

iihero@ChinaUnixehero.blog.chinaunix.net

博客访问： 1349572
博文数量： 185
博客积分： 50
博客等级：民兵
技术积分： 3934
用户组：普通用户
注册时间： 2007-09-11 13:11

个人简介

iihero@ChinaUnix, ehero.[iihero] 数据库技术的痴迷爱好者. 您可以通过iihero AT qq.com联系到我以下是我的三本图书: Sybase ASE in Action, Oracle Spatial及OCI高级编程, Java2网络协议内幕

文章分类

全部博文（185）

数据库综合（5）
SAP HANA（0）
SAP SybaseA（57）
PostgreSQL（12）
Oracle（16）
MySQL（9）
SQLite（10）
DB2（1）
项目管理与架构（20）

善用软件（1）
Java（16）
Python（2）
C/C++（5）
编程工具（4）
云计算（3）
搜索引擎（3）
Linux及Unix（3）
GIS（2）
个人随笔（17）
未分配的博文（0）

文章存档

2014年（4）

2013年（181）

我的朋友

相关博文

sqlite3 jdbc、c接口、python接口处理中文时遇到的问题及其解决方法

分类： Python/Ruby

2013-07-18 09:53:14

sqlite(版本3)，以下简称sqlite3，目前功能已经非常强大。目前支持的字符集，包括UTF-8, UTF-16,UTF-16le,UTF-16be。

可是在我们直接使用gbk编码的时候，很可能就会遇到问题。

因为目前，很多人会使用c/c++接口来访问sqlite3数据库，当然，也有人使用python接口来访问它。
1. 使用python时，要想正确的取到c++接口insert/update以后的数据，需要设定Connection的text_factory值为str,
意思是直接使用原来存储时的encoding形式。

con=sqlite3.connect(r"e:/t/testsqlite3.db")
con.text_factory=str

2. 使用sqlite jdbc访问的时候，如果想正确的取到c接口insert/update以后的数据，必须进行转码。
不过，转码时很奇怪，居然是用到：

String.getBytes("ISO_8859_1"), "GBK")

看来，c接口存储到sqlite3里边的数据，默认都是ISO_8859_1格式的，除非在insert/update以前，将其转换成utf-8再进行入库操作。

目前，sqlite jdbc以及python默认的存储方式是将字符串转换成utf-8串，再进行入库，非常标准。它们自己的upsert操作，然后取出数据，不会有任何问题。这个在我的前一篇短文里也有详细的描述。

阅读(2236) | 评论(0) | 转发(0) |

上一篇： python用法:处理sqlite中的中文字符时遇到的问题

下一篇：其实，学习编程的过程就是学习造轮子的过程，还是拥抱造轮子吧

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6