Python类与对象序列化_pickle应用解析【教程】

发布时间 - 2025-12-31 00:00:00    点击率:
pickle是Python对象序列化为二进制字节流的机制,依赖类定义存在,不支持lambda、局部类、文件句柄等;反序列化不可信数据有安全风险,推荐json/msgpack跨语言、dill/joblib替代。

Python 的 pickle 模块是实现类与对象序列化的最直接方式,但它不是万能的“黑箱”,用对了省时省力,用错了会报错、丢数据甚至引发安全风险。

什么是 pickle:对象到字节流的“快照”

pickle 不是把对象转成 JSON 那样的文本格式,而是将 Python 对象的状态(包括类型、属性值、引用关系)原样封存为二进制字节流。它专为 Python 生态设计,反序列化时必须能重新导入原始类定义。

例如有一个简单类:

class Person:
  def __init__(self, name, age):
    self.name = name
    self.age = age

创建实例 p = Person("Alice", 30) 后,用 pickle.dumps(p) 得到一串字节;再用 pickle.loads(字节) 就能还原出完全相同的对象(前提是运行环境中已定义 Person 类)。

立即学习“Python免费学习笔记(深入)”;

常见踩坑点:哪些对象不能 pickle?

pickle 无法处理以下几类内容,遇到就会抛 AttributeErrorPicklingError

  • lambda 函数、嵌套函数、未命名的局部函数
  • 模块顶层以外定义的类(比如在函数内部定义的 class)
  • 打开的文件对象、网络连接、数据库游标等运行时资源
  • 某些 C 扩展类型(如 NumPy 数组需用 numpy.save 更稳妥)

如果类中包含不可 pickle 的属性(如临时缓存或 socket),可重写 __getstate__ 方法,返回一个剔除这些字段的字典。

安全警告:不要 unpickle 不可信的数据

pickle 反序列化过程会执行任意代码(如调用 __reduce__ 返回的构造逻辑),恶意构造的字节流可能删除文件、启动进程。生产环境绝对禁止用 pickle.loads() 解析来自用户、网络或外部文件的输入。

替代方案推荐:

  • 需要跨语言 → 用 json(仅支持基础类型)或 msgpack
  • 需保留 Python 类型且可信环境 → pickle 仍是最简方案
  • 大数据科学场景 → dill(支持更多对象类型)或 joblib(针对 numpy/scikit-learn 优化)

实用技巧:保存/加载类实例到文件

最常用模式是搭配 open(..., "wb")open(..., "rb")

# 保存
with open("person.pkl", "wb") as f:
  pickle.dump(p, f)

# 加载
with open("person.pkl", "rb") as f:
  p2 = pickle.load(f)

注意:多个对象可连续 pickle.dump() 到同一文件,读取时也需按顺序多次 pickle.load();若想一次存多个,建议先放进列表再 dump。

不复杂但容易忽略:版本兼容性。不同 Python 版本的 pickle 协议默认不同(如 Python 3.8 默认 protocol=4),低版本可能无法加载高版本生成的文件。显式指定协议可提升兼容性:pickle.dump(obj, f, protocol=4)


# python  # js  # json  # 大数据  # 字节  # red 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 音乐网站服务器如何优化API响应速度?  Laravel项目怎么部署到Linux_Laravel Nginx配置详解  如何用西部建站助手快速创建专业网站?  如何在阿里云域名上完成建站全流程?  独立制作一个网站多少钱,建立网站需要花多少钱?  Laravel的.env文件有什么用_Laravel环境变量配置与管理详解  QQ浏览器网页版登录入口 个人中心在线进入  Laravel如何使用Eloquent进行子查询  如何用狗爹虚拟主机快速搭建网站?  iOS发送验证码倒计时应用  Laravel如何配置和使用缓存?(Redis代码示例)  Laravel怎么使用Blade模板引擎_Laravel模板继承与Component组件复用【手册】  Laravel如何为API生成Swagger或OpenAPI文档  如何选择PHP开源工具快速搭建网站?  Android自定义listview布局实现上拉加载下拉刷新功能  悟空浏览器如何设置小说背景色_悟空浏览器背景色设置【方法】  Laravel Admin后台管理框架推荐_Laravel快速开发后台工具  制作旅游网站html,怎样注册旅游网站?  如何在浏览器中启用Flash_2025年继续使用Flash Player的方法【过时】  香港服务器网站推广:SEO优化与外贸独立站搭建策略  北京网页设计制作网站有哪些,继续教育自动播放怎么设置?  Win11应用商店下载慢怎么办 Win11更改DNS提速下载【修复】  极客网站有哪些,DoNews、36氪、爱范儿、虎嗅、雷锋网、极客公园这些互联网媒体网站有什么差异?  Python图片处理进阶教程_Pillow滤镜与图像增强  如何在Ubuntu系统下快速搭建WordPress个人网站?  Laravel Artisan命令怎么自定义_创建自己的Laravel命令行工具完全指南  谷歌Google入口永久地址_Google搜索引擎官网首页永久入口  Win11怎么设置默认图片查看器_Windows11照片应用关联设置  如何用AI一键生成爆款短视频文案?小红书AI文案写作指令【教程】  BootStrap整体框架之基础布局组件  Laravel怎么判断请求类型_Laravel Request isMethod用法  jQuery validate插件功能与用法详解  惠州网站建设制作推广,惠州市华视达文化传媒有限公司怎么样?  Laravel怎么返回JSON格式数据_Laravel API资源Response响应格式化【技巧】  如何快速查询网址的建站时间与历史轨迹?  Laravel如何实现模型的全局作用域?(Global Scope示例)  Laravel怎么实现前端Toast弹窗提示_Laravel Session闪存数据Flash传递给前端【方法】  如何用AI帮你把自己的生活经历写成一个有趣的故事?  zabbix利用python脚本发送报警邮件的方法  千库网官网入口推荐 千库网设计创意平台入口  如何将凡科建站内容保存为本地文件?  北京网站制作公司哪家好一点,北京租房网站有哪些?  如何快速搭建安全的FTP站点?  php485函数参数是什么意思_php485各参数详细说明【介绍】  Java遍历集合的三种方式  Python3.6正式版新特性预览  Linux系统命令中screen命令详解  Laravel怎么写单元测试_PHPUnit在Laravel项目中的基础测试入门  如何用ChatGPT准备面试 模拟面试问答与职场话术练习教程  Laravel怎么调用外部API_Laravel Http Client客户端使用