Python 中Pickle库的使用详解-码农528-ChinaUnix博客

码农528

首页　| 　博文目录　| 　关于我

鐮佸啘528

博客访问： 156752
博文数量： 130
博客积分： 0
博客等级：民兵
技术积分： 1302
用户组：普通用户
注册时间： 2018-11-15 23:50

个人简介

.。。。。。。。

文章分类

全部博文（130）

python日常使用问（1）
docker（1）
go题目（2）
go博客开发（8）
svn（1）
python（5）
ajax（3）
jquery（1）
JavaScript（1）
python模块-文件（13）
python面向对象（13）
数据结构（0）
机器学习（0）
redis（5）
mysql（9）
linux（5）
flask（3）
Django（8）
python基础（23）
爬虫（11）
大数据（16）
未分配的博文（1）

文章存档

2022年（12）

2018年（118）

我的朋友

相关博文

Python 中Pickle库的使用详解

分类： Python/Ruby

2018-11-22 22:56:03

Python 中Pickle库的使用详解

pickle是python语言的一个标准模块，安装python后已包含pickle库，不需要单独再安装。这篇文章主要介绍了

Python 中Pickle库的使用详解,需要的朋友可以参考下

在“通过简单示例来理解什么是机器学习”这篇文章里提到了pickle库的使用，本文来做进一步的阐述。

那么为什么需要序列化和反序列化这一操作呢？

　　1.便于存储。序列化过程将文本信息转变为二进制数据流。这样就信息就容易存储在硬盘之中，当需要读取文件的时候，从硬盘中读取数据，然后再将其反序列化便可以得到原始的数据。在Python程序运行中得到了一些字符串、列表、字典等数据，想要长久的保存下来，方便以后使用，而不是简单的放入内存中关机断电就丢失数据。python模块大全中的Pickle模块就派上用场了，它可以将对象转换为一种可以传输或存储的格式。

　　2.便于传输。当两个进程在进行远程通信时，彼此可以发送各种类型的数据。无论是何种类型的数据，都会以二进制序列的形式在网络上传送。发送方需要把這个对象转换为字节序列，在能在网络上传输；接收方则需要把字节序列在恢复为对象。

通过简单示例来理解什么是机器学习

pickle是python语言的一个标准模块，安装python后已包含pickle库，不需要单独再安装。

pickle模块实现了基本的数据序列化和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去，永久存储；通过pickle模块的反序列化操作，我们能够从文件中创建上一次程序保存的对象。

在官方的介绍中，序列化操作的英文描述有好几个单词，如”serializing”, “pickling”, “serialization”, “marshalling” 或者”flattening”等，它们都代表的是序列化的意思。相应的，反序列化操作的英文单词也有好多个，如”de-serializing”, “unpickling”, “deserailization”等。为了避免混淆，一般用”pickling”/“unpickling”, 或者”serialization”/“deserailization”。

pickle模块是以二进制的形式序列化后保存到文件中（保存文件的后缀为”.pkl”），不能直接打开进行预览。而python的另一个序列化标准模块json，则是human-readable的，可以直接打开查看（例如在notepad++中查看）。

pickle模块有两类主要的接口，即序列化和反序列化。

其中序列化操作包括：

1 2	pickle.dump() Pickler(file, protocol).dump(obj)

反序列化操作包括：

1 2	pickle.load() Unpickler(file).load()

2 序列化操作

2.1 序列化方法pickle.dump()

序列化的方法为 pickle.dump()，该方法的相关参数如下：

1	pickle.dump(obj, file, protocol=None,*,fix_imports=True)

该方法实现的是将序列化后的对象obj以二进制形式写入文件file中，进行保存。它的功能等同于 Pickler(file, protocol).dump(obj)。

关于参数file，有一点需要注意，必须是以二进制的形式进行操作（写入）。

参考前文的案例如下：

1 2	import picklewith open('svm_model_iris.pkl', 'wb') as f: pickle.dump(svm_classifier, f)

file为'svm_model_iris.pkl'，并且以二进制的形式（'wb'）写入。

关于参数protocol，一共有5中不同的类型，即（0,1,2,3,4）。（0,1,2）对应的是python早期的版本，（3,4）则是在python3之后的版本。

此外，参数可选 pickle.HIGHEST_PROTOCOL和pickle.DEFAULT_PROTOCOL。当前，python3.5版本中，pickle.HIGHEST_PROTOCOL的值为4，pickle.DEFAULT_PROTOCOL的值为3。当protocol参数为负数时，表示选择的参数是pickle.HIGHEST_PROTOCOL。

关于参数protocol，官方的详细介绍如下：

2.2 序列化方法pickle.dumps()

pickle.dumps()方法的参数如下：