序列化/反序列化

╰半夏微凉° 2023-02-24 03:52 188阅读 0赞

序列化/反序列化

转载声明

本文大量内容系转载自网络,有删改,并参考其他文档资料加入了一些内容:

  • java序列化,看这篇就够了
    作者:9龙
    出处:https://www.cnblogs.com/9dragon/

1 序列化的含义、意义及使用场景

  • 序列化:将对象写入到IO流中
  • 反序列化:从IO流中恢复对象
  • 意义:序列化机制允许将实现序列化的Java对象转换位字节序列,这些字节序列可以保存在磁盘上,或通过网络传输,以达到以后恢复成原来的对象。序列化机制使得对象可以脱离程序的运行而独立存在。
  • 使用场景:所有可在网络上传输的对象都必须是可序列化的,比如RMI(remote method invoke,即远程方法调用),传入的参数或返回的对象都是可序列化的,否则会出错;所有需要保存到磁盘的java对象都必须是可序列化的。通常建议:程序创建的每个JavaBean类都实现Serializeable接口。

2 JDK提供的序列化实现的方式

2.1 概述

如果需要使用JDK原生方式将某个对象保存到磁盘上或者通过网络传输,那么这个类应该实现Serializable接口或者Externalizable接口之一。

2.2 Serializable

2.2.1 普通序列化

Serializable接口是一个标记接口,不用实现任何方法。一旦实现了此接口,该类的对象就是可序列化的。

序列化步骤:

  1. 创建一个ObjectOutputStream输出流;
  2. 调用ObjectOutputStream对象的writeObject输出可序列化对象。

    1. public class Person implements Serializable {
    2. private String name;
    3. private int age;
    4. //我不提供无参构造器
    5. public Person(String name, int age) {
    6. this.name = name;
    7. this.age = age;
    8. }
    9. @Override
    10. public String toString() {
    11. return "Person{" +
    12. "name='" + name + '\'' +
    13. ", age=" + age +
    14. '}';
    15. }
    16. }
    17. public class WriteObject {
    18. public static void main(String[] args) {
    19. try (//创建一个ObjectOutputStream输出流
    20. ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("object.txt"))) {
    21. //将对象序列化到文件s
    22. Person person = new Person("9龙", 23);
    23. oos.writeObject(person);
    24. } catch (Exception e) {
    25. e.printStackTrace();
    26. }
    27. }
    28. }

反序列化步骤:

  1. 创建一个ObjectInputStream输入流;
  2. 调用ObjectInputStream对象的readObject()得到序列化的对象。

    1. public class Person implements Serializable {
    2. private String name;
    3. private int age;
    4. //我不提供无参构造器
    5. public Person(String name, int age) {
    6. System.out.println("反序列化,你调用我了吗?");
    7. this.name = name;
    8. this.age = age;
    9. }
    10. @Override
    11. public String toString() {
    12. return "Person{" +
    13. "name='" + name + '\'' +
    14. ", age=" + age +
    15. '}';
    16. }
    17. }
    18. public class ReadObject {
    19. public static void main(String[] args) {
    20. try (//创建一个ObjectInputStream输入流
    21. ObjectInputStream ois = new ObjectInputStream(new FileInputStream("person.txt"))) {
    22. Person brady = (Person) ois.readObject();
    23. System.out.println(brady);
    24. } catch (Exception e) {
    25. e.printStackTrace();
    26. }
    27. }
    28. }

输出结果:
Person{name=‘9龙’, age=23}

注意点:
反序列化并不会调用构造方法。反序列的对象是由JVM自己生成的对象,不通过构造方法生成。

小结:

  • 序列化时,会将能序列化的所有成员对象都序列化,不管是不是private

2.2.2 成员是引用的序列化

如果一个可序列化的类的成员不是基本类型,也不是String类型,那这个引用类型也必须是可序列化的;否则,会导致此类不能序列化。

看例子,我们新增一个Teacher类。将Person去掉实现Serializable接口代码。

  1. public class Person{
  2. //省略相关属性与方法
  3. }
  4. public class Teacher implements Serializable {
  5. private String name;
  6. private Person person;
  7. public Teacher(String name, Person person) {
  8. this.name = name;
  9. this.person = person;
  10. }
  11. public static void main(String[] args) throws Exception {
  12. try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("teacher.txt"))) {
  13. Person person = new Person("路飞", 20);
  14. Teacher teacher = new Teacher("雷利", person);
  15. oos.writeObject(teacher);
  16. }
  17. }
  18. }

执行结果:
在这里插入图片描述

我们看到程序直接报错,因为Person类的对象是不可序列化的,这导致了Teacher的对象不可序列化

2.2.3 子类继承父类序列化

  • 如果序列化对象继承了父类,则父类也必须implements Serializable,否则会报错序列化错误;
  • 如果不想父类实现Serializable接口,则必须做到:

    • 父类要有一个无参的构造函数;
    • 子类必须负责序列化(反序列化)父类的field,否则会忽略父类的成员变量。
  • 如果父类已经实现Serializable,则子类不要实现Serializable,否则不会序列化/反序列化父类属性

2.2.4 同一对象序列化多次的机制

同一对象序列化多次,会将这个对象序列化多次吗?答案是否定的。

  1. public class WriteTeacher {
  2. public static void main(String[] args) throws Exception {
  3. try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("teacher.txt"))) {
  4. Person person = new Person("路飞", 20);
  5. Teacher t1 = new Teacher("雷利", person);
  6. Teacher t2 = new Teacher("红发香克斯", person);
  7. //依次将4个对象写入输入流
  8. oos.writeObject(t1);
  9. oos.writeObject(t2);
  10. oos.writeObject(person);
  11. oos.writeObject(t2);
  12. }
  13. }
  14. }

依次将t1、t2、person、t2对象序列化到文件teacher.txt文件中。

注意:反序列化的顺序与序列化时的顺序一致。

  1. public class ReadTeacher {
  2. public static void main(String[] args) {
  3. try (ObjectInputStream ois = new ObjectInputStream(new FileInputStream("teacher.txt"))) {
  4. Teacher t1 = (Teacher) ois.readObject();
  5. Teacher t2 = (Teacher) ois.readObject();
  6. Person p = (Person) ois.readObject();
  7. Teacher t3 = (Teacher) ois.readObject();
  8. System.out.println(t1 == t2);
  9. System.out.println(t1.getPerson() == p);
  10. System.out.println(t2.getPerson() == p);
  11. System.out.println(t2 == t3);
  12. System.out.println(t1.getPerson() == t2.getPerson());
  13. } catch (Exception e) {
  14. e.printStackTrace();
  15. }
  16. }
  17. }

输出结果:

  1. false
  2. true
  3. true
  4. true
  5. true

从输出结果可以看出,Java序列化同一对象,并不会将此对象序列化多次得到多个对象。

2.2.5 Java序列化算法

  1. 所有保存到磁盘的对象都有一个序列化编码号
  2. 当程序试图序列化一个对象时,会先检查此对象是否已经序列化过,只有此对象从未(在此虚拟机)被序列化过,才会将此对象序列化为字节序列输出。
  3. 如果此对象已经序列化过,则直接输出编号即可。

图示上述序列化过程:
在这里插入图片描述

2.2.6 java序列化算法潜在的问题

由于java序利化算法不会重复序列化同一个对象,只会记录已序列化对象的编号。如果序列化一个可变对象(对象内的内容可更改)后,更改了对象内容,再次序列化,并不会再次将此对象转换为字节序列,而只是保存序列化编号。

  1. public class WriteObject {
  2. public static void main(String[] args) {
  3. try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("person.txt"));
  4. ObjectInputStream ios = new ObjectInputStream(new FileInputStream("person.txt"))) {
  5. //第一次序列化person
  6. Person person = new Person("9龙", 23);
  7. oos.writeObject(person);
  8. System.out.println(person);
  9. //修改name
  10. person.setName("海贼王");
  11. System.out.println(person);
  12. //第二次序列化person
  13. oos.writeObject(person);
  14. //依次反序列化出p1、p2
  15. Person p1 = (Person) ios.readObject();
  16. Person p2 = (Person) ios.readObject();
  17. System.out.println(p1 == p2);
  18. System.out.println(p1.getName().equals(p2.getName()));
  19. } catch (Exception e) {
  20. e.printStackTrace();
  21. }
  22. }
  23. }

输出结果:

  1. Person{name='9龙', age=23}
  2. Person{name='海贼王', age=23}
  3. true
  4. true

2.2.7 可选的自定义序列化

2.2.7.1 transient

有些时候,我们有这样的需求,某些属性不需要序列化。使用transient关键字选择不需要序列化的字段。

  1. public class Person implements Serializable {
  2. //不需要序列化名字与年龄
  3. private transient String name;
  4. private transient int age;
  5. private int height;
  6. private transient boolean singlehood;
  7. public Person(String name, int age) {
  8. this.name = name;
  9. this.age = age;
  10. }
  11. //省略get,set方法
  12. }
  13. public class TransientTest {
  14. public static void main(String[] args) throws Exception {
  15. try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("person.txt"));
  16. ObjectInputStream ios = new ObjectInputStream(new FileInputStream("person.txt"))) {
  17. Person person = new Person("9龙", 23);
  18. person.setHeight(185);
  19. System.out.println(person);
  20. oos.writeObject(person);
  21. Person p1 = (Person)ios.readObject();
  22. System.out.println(p1);
  23. }
  24. }
  25. }

输出结果

  1. Person{name='9龙', age=23', singlehood=true', height=185cm}
  2. Person{name='null', age=0', singlehood=false', height=185cm}

java序列化时会忽略掉使用transient修饰的属性。

所以反序列化出的对象中被transient修饰的基本属性是默认值。而对于引用类型,值是null;基本类型,值是0;boolean类型,值是false。

2.2.7.2 重写writeObject与readObject

使用transient虽然简单,但将此属性完全隔离在了序列化之外。java提供了可选的自定义序列化。可以进行控制序列化的方式,或者对序列化数据进行编码加密等。

  1. private void writeObject(java.io.ObjectOutputStream out) throws IOException
  2. private void readObject(java.io.ObjectIutputStream in) throws IOException,ClassNotFoundException;
  3. private void readObjectNoData() throws ObjectStreamException;

通过重写writeObject与readObject方法,可以自己选择哪些属性需要序列化, 哪些属性不需要。如果writeObject使用某种规则序列化,则相应的readObject需要相反的规则反序列化,以便能正确反序列化出对象。

比如对name进行反转加密。

  1. public class Person implements Serializable {
  2. private String name;
  3. private int age;
  4. //省略构造方法,get及set方法
  5. private void writeObject(ObjectOutputStream out) throws IOException {
  6. //将名字反转写入二进制流
  7. out.writeObject(new StringBuffer(this.name).reverse());
  8. out.writeInt(age);
  9. }
  10. private void readObject(ObjectInputStream ins) throws IOException,ClassNotFoundException{
  11. //将读出的字符串反转恢复回来
  12. this.name = ((StringBuffer)ins.readObject()).reverse().toString();
  13. this.age = ins.readInt();
  14. }
  15. }

当序列化流不完整时,readObjectNoData()方法可以用来正确地初始化反序列化的对象。例如,使用不同类接收反序列化对象,或者序列化流被篡改时,系统都会调用readObjectNoData()方法来初始化反序列化的对象。

2.2.7.3 更彻底的自定义序列化

  1. // 在序列化时,会先调用此方法,再调用writeObject方法。此方法可将任意对象代替目标序列化对象
  2. ANY-ACCESS-MODIFIER Object writeReplace() throws ObjectStreamException;
  3. public class Person implements Serializable {
  4. private String name;
  5. private int age;
  6. //省略构造方法,get及set方法
  7. private Object writeReplace() throws ObjectStreamException {
  8. ArrayList<Object> list = new ArrayList<>(2);
  9. list.add(this.name);
  10. list.add(this.age);
  11. return list;
  12. }
  13. public static void main(String[] args) throws Exception {
  14. try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("person.txt"));
  15. ObjectInputStream ios = new ObjectInputStream(new FileInputStream("person.txt"))) {
  16. Person person = new Person("9龙", 23);
  17. oos.writeObject(person);
  18. ArrayList list = (ArrayList)ios.readObject();
  19. System.out.println(list);
  20. }
  21. }
  22. }

输出结果

  1. [9龙, 23]
  2. // 反序列化时替换反序列化出的对象,反序列化出来的对象被立即丢弃。
  3. // 此方法在readeObject后调用。
  4. ANY-ACCESS-MODIFIER Object readResolve() throws ObjectStreamException;
  5. readResolve
  6. public class Person implements Serializable {
  7. private String name;
  8. private int age;
  9. //省略构造方法,get及set方法
  10. private Object readResolve() throws ObjectStreamException{
  11. return new ("brady", 23);
  12. }
  13. public static void main(String[] args) throws Exception {
  14. try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("person.txt"));
  15. ObjectInputStream ios = new ObjectInputStream(new FileInputStream("person.txt"))) {
  16. Person person = new Person("9龙", 23);
  17. oos.writeObject(person);
  18. HashMap map = (HashMap)ios.readObject();
  19. System.out.println(map);
  20. }
  21. }
  22. }

输出结果

  1. { brady=23}

readResolve常用来反序列单例类,保证单例类的唯一性。

注意:readResolve与writeReplace的访问修饰符可以是private、protected、public,如果父类重写了这两个方法,子类都需要根据自身需求重写,这显然不是一个好的设计。通常建议对于final修饰的类重写readResolve方法没有问题;否则,重写readResolve使用private修饰。

2.3 Externalizable:强制自定义序列化

通过实现Externalizable接口,必须实现writeExternal、readExternal方法。

  1. public interface Externalizable extends java.io.Serializable {
  2. void writeExternal(ObjectOutput out) throws IOException;
  3. void readExternal(ObjectInput in) throws IOException, ClassNotFoundException;
  4. }
  5. public class ExPerson implements Externalizable {
  6. private String name;
  7. private int age;
  8. //注意,必须加上pulic 无参构造器
  9. public ExPerson() {
  10. }
  11. public ExPerson(String name, int age) {
  12. this.name = name;
  13. this.age = age;
  14. }
  15. @Override
  16. public void writeExternal(ObjectOutput out) throws IOException {
  17. //将name反转后写入二进制流
  18. StringBuffer reverse = new StringBuffer(name).reverse();
  19. System.out.println(reverse.toString());
  20. out.writeObject(reverse);
  21. out.writeInt(age);
  22. }
  23. @Override
  24. public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
  25. //将读取的字符串反转后赋值给name实例变量
  26. this.name = ((StringBuffer) in.readObject()).reverse().toString();
  27. System.out.println(name);
  28. this.age = in.readInt();
  29. }
  30. public static void main(String[] args) throws IOException, ClassNotFoundException {
  31. try (ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("ExPerson.txt"));
  32. ObjectInputStream ois = new ObjectInputStream(new FileInputStream("ExPerson.txt"))) {
  33. oos.writeObject(new ExPerson("brady", 23));
  34. ExPerson ep = (ExPerson) ois.readObject();
  35. System.out.println(ep);
  36. }
  37. }
  38. }

输出结果

  1. ydarb
  2. brady
  3. ExPerson{name='brady', age=23}

注意:Externalizable接口不同于Serializable接口:

  • 实现此接口必须实现接口中的两个方法实现自定义序列化,这是强制性的;
  • 必须提供pulic的无参构造器,因为在反序列化的时候需要反射调用构造方法来创建对象。

2.4 JDK两种序列化对比






















实现Serializable接口 实现Externalizable接口
系统自动存储必要的信息 程序员决定存储哪些信息
Java内建支持,易于实现,只需要实现该接口即可,无需任何代码支持 必须实现接口内的两个方法
性能略差 性能略好

虽然Externalizable接口带来了一定的性能提升,但变成复杂度也提高了,所以一般通过实现Serializable接口进行序列化。

2.5 serialVersionUID-序列化版本号

我们知道,反序列化必须拥有class文件,但随着项目的升级,class文件也会升级,序列化怎么保证升级前后的兼容性呢?

java序列化提供了一个private static final long serialVersionUID的序列化版本号,只有版本号相同,即使更改了序列化属性,对象也可以正确被反序列化回来。

  1. public class Person implements Serializable {
  2. //序列化版本号
  3. private static final long serialVersionUID = 1111013L;
  4. private String name;
  5. private int age;
  6. //省略构造方法及get,set
  7. }

如果反序列化使用的class因为Class属性变化导致版本号与序列化时使用的不一致,反序列化会报InvalidClassException异常。
在这里插入图片描述

序列化版本号可自由指定,如果不指定,JVM会根据类信息自己计算一个版本号,这样随着class的升级,就无法正确反序列化;不指定版本号另一个明显隐患是,不利于jvm间的移植,可能class文件没有更改,但不同jvm可能计算的规则不一样,这样也会导致无法反序列化。

什么情况下需要修改serialVersionUID呢?分三种情况。

  • 如果只是修改了方法,反序列化不容影响,则无需修改版本号; 实测修改了方法也会导致反序列化报错java.io.InvalidClassException: demos.Serializable.test1.Person; local class incompatible
  • 如果只是修改了静态变量,瞬态变量(transient修饰的变量),反序列化不受影响,无需修改版本号;
  • 如果修改了非瞬态变量,则可能导致反序列化失败。
    如果新类中实例变量的类型与序列化时类的类型不一致,则会反序列化失败,这时候需要更改serialVersionUID。

    如果只是新增了实例变量,则反序列化回来新增的是默认值;如果减少了实例变量,反序列化时会忽略掉减少的实例变量。

总的来说,当序列号显式一致的时候,序列化前后类变动的多余的内容或者减少的内容不会影响反序列化,即反序列化时多余的部分将忽略,少的部分将取默认值。

但如果没有显式指定序列号,会因为JVM为该类自动生成的序列号变化而发生错误反序列化错误。

但如果是实例字段类型或方法描述发生变化,则会反序列化失败,这时候需要更改serialVersionUID。

例子可参考

  • private static final long serialVersionUID = 1L这句话到底什么意思?

2.5 JDK序列化总结

  • 所有需要网络传输的对象都需要实现序列化接口,通过建议所有的javaBean都实现Serializable接口。
  • 对象的类名、实例变量(包括基本类型,数组,对其他对象的引用)都会被序列化;
  • 方法、类变量、transient实例变量都不会被序列化。
  • 如果想让某个变量不被序列化,使用transient修饰。
  • 序列化对象的引用类型成员变量,也必须是可序列化的,否则,会报错。
  • 反序列化时必须有序列化对象的class文件。
  • 当通过文件、网络来读取序列化后的对象时,必须按照实际写入的顺序读取。
  • 单例类序列化,需要重写readResolve()方法以使得每次返回同一个对象;否则会破坏单例原则。
  • 同一对象序列化多次,只有第一次序列化为二进制流,以后都只是保存序列化编号,不会重复序列化。
  • 建议所有可序列化的类加上serialVersionUID 版本号,方便项目升级。

2.6 JDK序列化问题

  • 效率低
  • 安全问题
    Java中的默认序列化是存在一些安全问题的,例如对象序列化以后的字节通过网络传输,有可能在网络中被截取。那如何保证数据安全呢?通常可以在对象序列化时对对象内容进行加密,对象反序列化时对内容进行解密。详见Java中的默认序列化存在安全问题如何解决?
  • 序列化结果太大

3 Protobuf

3.1 简介

Java序列化组件效率低,有安全问题,所以现在各大开源组件基本都不再使用JDK序列化,而是使用第三方序列化工具,来自google的Protobuf大放异彩。

Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,或者说序列化。它很适合做数据存储或 RPC 数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。目前提供了 C++、Java、Python 三种语言的 API。

3.2 Protobuf安装

  • 下载: Protocol Buffers releases
  • 解压
  • 安装

    1. cd protoc-3.6.1-osx-x86_64
    2. cp -r include/ /usr/local/include/
    3. cp -r bin/ /usr/local/bin/
  • 测试

    1. protoc --version
    2. protoc --help

3.3 idea 配置

pom.xml增加:

  1. <dependencies>
  2. <!--protobuf-->
  3. <dependency>
  4. <groupId>com.google.protobuf</groupId>
  5. <artifactId>protobuf-java</artifactId>
  6. <version>3.6.1</version>
  7. </dependency>
  8. <dependency>
  9. <groupId>com.google.protobuf</groupId>
  10. <artifactId>protobuf-java-util</artifactId>
  11. <version>3.6.1</version>
  12. </dependency>
  13. </dependencies>
  14. <build>
  15. <resources>
  16. <resource>
  17. <directory>src/main/resources</directory>
  18. <filtering>true</filtering>
  19. </resource>
  20. </resources>
  21. <plugins>
  22. <!--protobuf .proto->.java -->
  23. <plugin>
  24. <groupId>org.xolstice.maven.plugins</groupId>
  25. <artifactId>protobuf-maven-plugin</artifactId>
  26. <version>0.5.0</version>
  27. <configuration>
  28. <protocArtifact>
  29. com.google.protobuf:protoc:3.6.1:exe:${os.detected.classifier}
  30. </protocArtifact>
  31. <pluginId>protoc-java</pluginId>
  32. <protoSourceRoot>${project.basedir}/src/main/resources/netty/protobuf</protoSourceRoot>
  33. <!-- <pluginId>grpc-java</pluginId> <pluginArtifact> io.grpc:protoc-gen-grpc-java:1.11.0:exe:${os.detected.classifier} </pluginArtifact>-->
  34. </configuration>
  35. <executions>
  36. <execution>
  37. <goals>
  38. <goal>compile</goal>
  39. <goal>compile-custom</goal>
  40. </goals>
  41. </execution>
  42. </executions>
  43. </plugin>
  44. </plugins>
  45. <extensions>
  46. <!--protobuf-->
  47. <extension>
  48. <groupId>kr.motd.maven</groupId>
  49. <artifactId>os-maven-plugin</artifactId>
  50. <version>1.5.0.Final</version>
  51. </extension>
  52. </extensions>
  53. </build>

3.4 Idea Protobuf插件

以前叫Protobuf Support,但已经废弃:
在这里插入图片描述
新的插件名为:Protocol Buffer Editor

  • Git地址
  • 插件地址

3.5 .proto文件生成

在这里插入图片描述

3.6 .proto -> .java

在这里插入图片描述
生成的类如下:
在这里插入图片描述

发表评论

表情:
评论列表 (有 0 条评论,188人围观)

还没有评论,来说两句吧...

相关阅读

    相关 序列序列

    序列化和反序列化   摘要   序列化和反序列化几乎是工程师们每天都要面对的事情,但是要精确掌握这两个概念并不容易:一方面,它们往往作为框架的一部分出现而湮没

    相关 序列序列

    个人学习理解 (只是自己默写序列化和反序列的代码以及几个问题) 1.序列化 和 反序列化 1.1 什么是序列化 和 反序列化 或者 你如何理解序列化和

    相关 序列序列

    序列化: 对象的序列化主要有两种用途:   1) 把对象的字节序列永久地保存到硬盘上,通常存放在一个文件中;   2) 在网络上传送对象的字节序列。   

    相关 Java序列序列

    目录 1:什么是序列化、反序列化? 2:序列化的用途? 3:序列化的n种方式 1:什么是序列化、反序列化? 把对象转换为字节序列的过程称为对象的序列化