前言
Java的序列化与反序列化是Java中比较重要的一个知识,本文将总结一下,怎么使用序列化功能以及经常遇到的一些问题的解答.
什么是Java的序列化
JDK提供给我们的,可以将某一个对象转化为二进制字节流保存,并从字节流恢复对象的一种技术.
我们可以再网络传输对象,或者持久化对象时使用这项技术.
怎么进行序列化与反序列化
Java中通过继承Serializable接口来获得序列化与反序列化的能力,使用ObjectInputStream和ObjectOutputStream来进行具体的对象序列化读写.
示例如下:
1 | package daily; |
在上面的代码中,我们new了一个对象,并将其进行了序列化与反序列化,并在序列化之前和反序列化之后打印了对象的值,结果为值相同.同时,在桌面上生成了Serialized.set
文件.
为什么必须要实现Serializable接口?
点开该接口的源码,我们可以发现,这是一个空的接口,即没有任何的定义,那么它是怎么使用的呢?
在序列化的过程中,我们会调用ObjectOutputStream
的writeObject
方法,该方法,该方法调用writeObject0
方法,该方法中有如下代码:
1 | if (obj instanceof String) { |
可以看到,对传入的对象进行了几次判断,分别判断传入对象是否为:String
,Array
,Enum
,Serializable
.
什么意思呢?就是JDK规定了,只有字符串
,数组
,枚举
,Serializable
四种对象才允许序列化,其他的都会抛出NotSerializableException
异常.
而这四种中,前面三种都是内定
的,只有最后一种是留给程序员的序列化通道,因此我们想要序列化某一个类,必须实现Serializable
接口.
序列化ID是干什么用的?
在看一些开源框架的代码时,发现他们的类都会有private static final long serialVersionUID = 8683452581122892189L;
这个属性,这是用来干什么的呢?
序列化和反序列化的匹配是怎么匹配的?总不能随便来的吧,A类序列化后的二进制文件,B类能从哪里读出一个对象来嘛?
不能,类的路径以及功能代码必须完全相同,而序列化ID也是用来补充这一判断的.
试想一下,你在服务里new了一个对象,并将其序列化使用网络传输,那么收到这个二进制流的人都能序列化吗?不是的,他必须在自己的服务中有同样的类路径,同样的类定义,同时,他的类中定义的序列化ID必须与你的一致才可以.算是一定程度上的安全性保证吧.
当然,日常开发中我们使用默认生成的1L
即可.
静态变量的序列化
我在上面的代码中,定义了一个静态变量,他也能被序列化吗?
在序列化之后,对静态变量重新赋值,那么两次打印的值相等吗?
打印结果是:
1 | 10 |
为什么呢?这个问题其实比较简单,静态变量是属于类的,而我们是序列化了对象,因此不包含类的静态变量是正常的.
transient 关键字
transient 关键字用于在序列化时,忽略某一个字段,在反序列化后该字段为初始值,比如int=0,对象引用为null.
ArrayList 的序列化
看了这么多理论知识,我们来看一下常用类ArrayList
是怎么序列化的吧.
ArrayList
实现了Serializable
自然不必多说,其中用来保存数据的属性定义为:
1 | /** |
为什么会定义为transient
呢?我序列化一个ArrayList,你不给我存储内部的值?我要你个空壳子干啥!我摔!
稳住,我们可以实际测试一下,会发现在序列化及反序列化的过程中,是保留了list中的值的.
为什么要定义为transient
呢?怎么做到仍然保留数据的呢?
第一个问题
ArrayList内部是使用数组实现的,虽然他是动态数组,但是也是数组.
也就是说,当你定义了长度为100的Arraylist,只放入了一个对象,剩下的99个就为空了.
序列化的时候有必要将这99个空也记录下来吗?没有.因此定义为了transient
.
第二个问题
在序列化的过程中,虚拟机会试图调用被序列化类的writeObject和readObject
方法,调用不到才会去执行默认的这两个方法,也就是对应的输入输出流中的方法.
在ArrayList中有如下代码:
1 | private void writeObject(java.io.ObjectOutputStream s) |
可以在代码中看到,ArrayList自定义的序列化方法,没有序列化99个空值,只序列化了有意义的值.
总结
1.java的序列化需要实现Serializable
接口,之后使用ObjectOutputStream
及ObjectInputStream
进行读写.
2.必须实现Serializable
是因为JDK中进行了检查,不属于那四个类就会抛异常且不允许序列化.
3.序列化ID可以起到验证是不是同一个类的作用,当然是在两个类的代码完全一样的基础上.
4.transient关键字可以忽略一些字段,使其不参与序列化.
5.静态变量是不会序列化的,因为序列化的是对象
,而静态变量属于类
.
6.可以参考ArrayList的实现方法实现自己的自定义序列化,在这个自定义的过程中,可以做许多事情,比如对某些字段加密(常用于密码字段).
参考链接
https://www.ibm.com/developerworks/cn/java/j-lo-serial/index.html
https://www.hollischuang.com/archives/1140
联系我
最后,欢迎关注我的个人公众号【 呼延十 】,会不定期更新很多后端工程师的学习笔记。
也欢迎直接公众号私信或者邮箱联系我,一定知无不言,言无不尽。
完.
ChangeLog
2019-01-28 完成以上皆为个人所思所得,如有错误欢迎评论区指正。
欢迎转载,烦请署名并保留原文链接。
更多学习笔记见个人博客——>呼延十