全部博文(2065)
分类: Python/Ruby
2010-04-21 20:58:37
python中Pickle模块
cPickle模块是使用C语言实现的,所以在运行效率上比pickle要高。但是cPickle模块中定义的类型不能被继承(其实大多数时候,我们不需 要从这些类型中继承。)。cPickle和pickle的序列化/反序列化规则是一样的,我们可以使用pickle序列化一个对象,然后使用 cPickle来反序列化。同时,这两个模块在处理自引用类型时会变得更加“聪明”,它不会无限制的递归序列化自引用对象,对于同一对象的多次引用,它只 会序列化一次。
笔记:序列化一个对象。将一个对象给序列化!
示例:
list = []
list.append(list)
byt2 = pickle.dumps(list)
默认情况下,pickle的序列化是基于文本的,我们可以直接用文本编辑器查看序列化的文本。我们也可以序列成二进制格式的数据,这样的结果体积会更小。
pickle.dump(obj,
file[, protocol])
序列化对象,并将结果数据流写入到文件对象中。参数protocol是序列化模式,默认值为0,表示以文本的形式序列化。protocol的值还可以 是1或2,表示以二进制的形式序列化。
pickle.load(file)
反序列化对象。将文件中的数据解析为一个Python对象。
笔记:序列化过程 将一个python对象序列化成文本或二进制。反序列刚好相反
class Person:
def __init__(self,name,address):
self.name = name
self.address = address
def dispaly(self):
print 'name',self.name,'address',self.address
people = Person('JGood','china')
people.dispaly()
file = StringIO.StringIO()
pickle.dump(people,file,0)
print
file.getvalue()
结果为:
(i__main__
Person
p0
(dp1
S'name'
p2
S'JGood'
p3
sS'address'
p4
S'china'
p5
sb.
这样就将一个对象给序列化了。
反序列操作
file.seek(0)
j1 = pickle.load(file)
j1.dispaly()
慢慢地发现序列化好像可以实现这样的操作哦。比如说我先将一个对象序列化到一个StringIO对象了即内存中去。然后程序可以休棉或干嘛。然后再反序列出来。
比如像游戏中的保存游戏状态再进来。其实这种效果应该是与序列化的效果一致的吧。
python模块中还定义了两个类,分别用来序列化、反序列化对象。
class pickle.Pickler(file[, protocal]):
该类用于序列化对象。参数file是一个类文件对象(file-like
object),用于保存序列化结果。可选参数表示序列化模式。它定义了两个方法:
dump(obj):
将对象序列化,并保存到类文件对象中。参数obj是要序列化的对象。[]
clear_memo()
清空pickler的“备忘”。使用Pickler实例在序列化对象的时候,它会“记住”已经被序列化的对象引用,所以对同一对象多次调用
dump(obj),pickler不会“傻傻”的去多次序列化。如果你调用了这个方法就会去多次序列化了。
将上面的示例重写:
people = Person('JGood','china')
people.dispaly()
file = StringIO.StringIO()
pick = pickle.Pickler(file)
pick.dump(people)
print
file.getvalue()
class pickle.Unpickler(file):
该类用于反序列化对象。参数file是一个类文件(file-like
object)对象,Unpickler从该参数中获取数据进行反序列化。
load():
反序列化对象。该方法会根据已经序列化的数据流,自动选择合适的反序列化模式。
以下是其他的示例补充:
1. 将一个对象序列化到一个文本
class Person:
def __init__(self,name,address):
self.name = name
self.address = address
def dispaly(self):
print 'name',self.name,'address',self.address
people = Person('JGood','china')
people.dispaly()
output = open('data.pkl', 'wb')
pick = pickle.Pickler(output)
pick.dump(people)
2. 将对象从文本中读取回来
pkl_file = open('data.pkl', 'rb') 读取到此文本内容
data1 = pickle.load(pkl_file) 反序列化
data1.dispaly() 跟调用这个类是一样的了
我测试发现了。如果将这个类给删除掉就会报:AttributeError: 'module' object has no attribute 'Person'
看来还得让反序列后的数据能够找到这个类才行!
补充:对象序列化
序列化就是将内存中的对象保存成可存或可传的形式。一般情况下,对象是根据类被实例化 到托管堆上的,一旦进程退出,整个对象被释放掉,如果再次实例化类,所得的对象,与先前的对象状态是不一样的,为此,序列化就成为一个有效的解决方式。
笔记:对象在程序退出的时候就会自动退了。所以可以通过序列化保存起来!
总结一句话,序列化就是把对象中的数据按一定规则组织成文件存储或组织成网络流进行传 输(Remoting中用到)