python用法:处理sqlite中的中文字符时遇到的问题-ehero-ChinaUnix博客

iihero@ChinaUnixehero.blog.chinaunix.net

博客访问： 1332841
博文数量： 185
博客积分： 50
博客等级：民兵
技术积分： 3934
用户组：普通用户
注册时间： 2007-09-11 13:11

个人简介

iihero@ChinaUnix, ehero.[iihero] 数据库技术的痴迷爱好者. 您可以通过iihero AT qq.com联系到我以下是我的三本图书: Sybase ASE in Action, Oracle Spatial及OCI高级编程, Java2网络协议内幕

文章分类

全部博文（185）

数据库综合（5）
SAP HANA（0）
SAP SybaseA（57）
PostgreSQL（12）
Oracle（16）
MySQL（9）
SQLite（10）
DB2（1）
项目管理与架构（20）

善用软件（1）
Java（16）
Python（2）
C/C++（5）
编程工具（4）
云计算（3）
搜索引擎（3）
Linux及Unix（3）
GIS（2）
个人随笔（17）
未分配的博文（0）

文章存档

2014年（4）

2013年（181）

我的朋友

相关博文

python用法:处理sqlite中的中文字符时遇到的问题

分类： Python/Ruby

2013-07-18 09:50:34

作为初学才，学起python，是挺快，但是也不免常常出些小错。在访问sqlite3的时候，我写了下边的测试代码。

文件test.py是utf-8编码的，OK，结果没问题。

#!/usr/bin/env python

#coding=utf-8

import sqlite3

#con=sqlite3.connect(r"sqlite.db")

con=sqlite3.connect(r"e: estsqlite3.db")

#con.text_factory=str

cur = con.cursor()

#cur.execute("insert into basvslvoy (vslcode,voyage,vslename) values(?,?,?)",(u'tt', u'tt', u'tt'))

cur.execute("insert into t1 values(?, ?)", (10, u'中文测试gbk10' ))

con.commit()

cur.execute(u"select * from t1 where col2 like '中%'")

for row in cur.fetchall():

print row[0], row[1].encode('gbk')

con.close()

结果如下：

Process started >>>

10 中文测试gbk10

5 中

10 中文测试gbk10

10 中文测试gbk10<<< Process finished.

可是，当我把文件编码调整成ansi格式的时候，上边程序没办法跑。
结果将文件内容改成下边的样子：

#!/usr/bin/env python
#coding=utf-8

import sqlite3

#con=sqlite3.connect(r"sqlite.db")
con=sqlite3.connect(r"e: estsqlite3.db")
#con.text_factory=str
cur = con.cursor()
#cur.execute("insert into basvslvoy (vslcode,voyage,vslename) values(?,?,?)",(u'tt', u'tt', u'tt'))
cur.execute("insert into t1 values(?, ?)", (10, '中文测试gbk10'.decode('gbk') ))
con.commit()
cur.execute("select * from t1 where col2 like '" + '中'.decode('gbk')+"%'")
for row in cur.fetchall():
print row[0], row[1].encode('gbk')

con.close()

这样，出现的结果跟上边一样。
问题的关键就是#coding=utf-8，同时文件编码也要是utf-8，才能让结果保持一致。
看看下边的简单例子就知道：

>>> a = '中文'

>>> b = u'中文'

>>> a

'????'

>>> b

u'中文'

>>> a.decode('gbk')

u'中文'

>>> b == a.decode('gbk')

True

如果将上边的例子放到一个.py文件当中，分别采用utf-8编码和ansi编码('cp936')，结果可能就是分别为True和False。

阅读(2727) | 评论(0) | 转发(0) |

上一篇：用python来解析xml文件(简单情况)

下一篇： sqlite3 jdbc、c接口、python接口处理中文时遇到的问题及其解决方法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6