首页 > 软件编程 > java > LambdaQueryWrapper实现原理和lambda序列化

LambdaQueryWrapper的实现原理分析和lambda的序列化问题

2022-01-11 08:37:25 作者：之诚

这篇文章主要介绍了LambdaQueryWrapper的实现原理分析和lambda的序列化问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教。

LambdaQueryWrapper的实现原理

mybatis-plus的LambdaQueryWrapper的lambda来组合查询字段的功能十分好用，但是它是如何实现的呢?

通过查看mybatis的源码发现它的功能主要是四个类来实现的。

在这里插入图片描述

我将其copy下来分析下。

SFunction 类

/**
 * 支持序列化的 Function
 *
 * @author miemie
 * @since 2018-05-12
 */
@FunctionalInterface
public interface SFunction<T, R> extends Function<T, R>, Serializable {
}

我们知道每个lambda表达式都有一个对应的接口，而mybatis-plus就是使用上面的接口来声明lambda表达式的。可以看到它实现了Serializable接口。

LambdaUtils

/**
 * Lambda 解析工具类
 *
 * @author HCL, MieMie
 * @since 2018-05-10
 */
public final class LambdaUtils {
.....................
 /**
     * 获取对应的表字段与对象的属性关系对象
     *
     * @param func
     * @param <T>
     * @return
     */
    public static <T> EntityTableDefine.ColumnProp getColumnProp(SFunction<T, ?> func) {
        SerializedLambda resolve = LambdaUtils.resolve(func);
        return getColumnProp(resolve);
    }
  /**
     * 解析 lambda 表达式, 该方法只是调用了 {@link SerializedLambda#resolve(SFunction)} 中的方法，在此基础上加了缓存。
     * 该缓存可能会在任意不定的时间被清除
     *
     * @param func 需要解析的 lambda 对象
     * @param <T>  类型，被调用的 Function 对象的目标类型
     * @return 返回解析后的结果
     * @see SerializedLambda#resolve(SFunction)
     */
    public static <T> SerializedLambda resolve(SFunction<T, ?> func) {
        Class<?> clazz = func.getClass();
        return Optional.ofNullable(FUNC_CACHE.get(clazz))
                .map(WeakReference::get)
                .orElseGet(() -> {
                    SerializedLambda lambda = SerializedLambda.resolve(func);
                    FUNC_CACHE.put(clazz, new WeakReference<>(lambda));
                    return lambda;
                });
    }
  
  
  ................... 
}

把其中最重要的两个方法贴出来，resolve 方法才是重点。可以看到其中调用了SerializedLambda.resolve(func);方法。

SerializedLambda

/**
 * 这个类是从 {@link java.lang.invoke.SerializedLambda} 里面 copy 过来的，
 * 字段信息完全一样
 * <p>负责将一个支持序列的 Function 序列化为 SerializedLambda</p>
 *
 * @author HCL
 * @since 2018/05/10
 */
@SuppressWarnings("unused")
public class SerializedLambda implements Serializable {
  ........
    
/**
     * 通过反序列化转换 lambda 表达式，该方法只能序列化 lambda 表达式，不能序列化接口实现或者正常非 lambda 写法的对象
     *
     * @param lambda lambda对象
     * @return 返回解析后的 SerializedLambda
     */
    public static SerializedLambda resolve(SFunction<?, ?> lambda) {
        if (!lambda.getClass().isSynthetic()) {
            throw ExceptionUtils.mpe("该方法仅能传入 lambda 表达式产生的合成类");
        }
        try (ObjectInputStream objIn = new ObjectInputStream(new ByteArrayInputStream(SerializationUtils.serialize(lambda))) {
            /**
             * 实现反序列化的类型的替换， 使用我们自定义的类型来替换java.lang.invoke.SerializedLambda类。
             * 为何可以替换成功， 因为反序列化的时候使用的是反射的方式赋值的， 只要两个类的方法名称或者字段名一样，反射调用是没有问题的。
             * @param objectStreamClass
             * @return
             * @throws IOException
             * @throws ClassNotFoundException
             */
            @Override
            protected Class<?> resolveClass(ObjectStreamClass objectStreamClass) throws IOException, ClassNotFoundException {
                Class<?> clazz = super.resolveClass(objectStreamClass);
                return clazz == java.lang.invoke.SerializedLambda.class ? SerializedLambda.class : clazz;
            }
        }) {
            //因为前面的替换，这里获取的就是我们自己定义的SerializedLambda类
            return (SerializedLambda) objIn.readObject();
        } catch (ClassNotFoundException | IOException e) {
            throw ExceptionUtils.mpe("This is impossible to happen", e);
        }
    }
  
  .............. 
    
 }

SerializationUtils.serialize(lambda)方法就是正常的序列化类，无什么特别的.

resolveClass方法才是重点方法，这个方法的目的是获取反序列化后的类的类型，上面是被重新了。参数ObjectStreamClass中是包含了反序列化后的类型，在jdk8之后lambda被反序列化后类型都是java.lang.invoke.SerializedLambda.class，这里重写进行了替换成自己定义的SerializedLambda类型。

两个类型的代码是一样的（没发现差异）， mybatis-plus之所以复制这个类是为了方便控制吧(猜测)。 SerializedLambda类中就包含了lambda的方法的名称，而get/set方法的名称自然就能对应到具体的字段了。

至于为何可以替换的原因我在这个方法上面注释了。

思考

序列化和反序列化是比价消耗性能的，所以mybatis-plus使用了static的Map和WeakReference来缓存了序列化后的SerializedLambda对象。至于为何使用WeakReference的方式来做缓存，可以参考下ThreadLocal的实现原理

其实mybatis-plus的实现方式显得繁琐了。其实没有必要去复制SerializedLambda类代码，也没有必要去真的序列化和反序列。

对象序列化中的 writeReplace 和 readResolve

writeReplace：在将对象序列化之前，如果对象的类或父类中存在writeReplace方法，则使用writeReplace的返回值作为真实被序列化的对象；writeReplace在writeObject之前执行；
readResolve：在将对象反序列化之后，ObjectInputStream.readObject返回之前，如果从对象流中反序列化得到的对象所属类或父类中存在readResolve方法，则使用readResolve的返回值作为ObjectInputStream.readObject的返回值；readResolve在readObject之后执行；

函数式接口如果继承了Serializable，使用Lambda表达式来传递函数式接口时，编译器会为Lambda表达式生成一个writeReplace方法，这个生成的writeReplace方法会返回java.lang.invoke.SerializedLambda；可以从反射Lambda表达式的Class证明writeReplace的存在（具体操作与截图在后面）；所以在序列化Lambda表达式时，实际上写入对象流中的是一个SerializedLambda对象，且这个对象包含了Lambda表达式的一些描述信息；

SerializedLambda类中有readResolve方法，这个readResolve方法中通过反射调用了Lambda表达式所在外部类中的** deserializeLambda deserializeLambda deserializeLambda**方法，这个方法是编译器自动生成的，可以通过反编译.class字节码证明（具体操作与截图在后面）； deserializeLambda deserializeLambda deserializeLambda方法内部解析SerializedLambda，并调用LambdaMetafactory.altMetafactory或LambdaMetafactory.metafactory方法（引导方法）得到一个调用点（CallSite），CallSite会被动态指定为Lambda表达式代表的函数式接口类型，并作为Lambda表达式返回；所以在从对象流反序列化得到SerializedLambda对象之后，又被转换成原来的Lambda表达式，通过ObjectInputStream.readObject返回；

从上面的黑体中就能够知道，在序列化lambda的时候实际上是序列化了SerializedLambda对象，所以反序列化后就能获取SerializedLambda对象了。实际上序列化的对象是通过writeReplace方法产生的，那么我们要获取SerializedLambda对象没必要真的序列化和反序列化一遍。反射调用writeReplace方法就可以了。

具体示例如下

package xyz.xiezc.ioc.starter.orm.lambda;
import cn.hutool.json.JSONUtil;
import lombok.Data;
import java.lang.invoke.SerializedLambda;
import java.lang.reflect.Method;
@Data
public class LambdaTest {
    private String fieldA;
    public static void main(String[] args) throws Exception {
        SerializedLambda serializedLambda = doSFunction(LambdaTest::getFieldA);
        System.out.println("方法名：" + serializedLambda.getImplMethodName());
        System.out.println("类名：" + serializedLambda.getImplClass());
        System.out.println("serializedLambda：" + JSONUtil.toJsonStr(serializedLambda));
    }
    private static <T, R> java.lang.invoke.SerializedLambda doSFunction(SFunction<T, R> func) throws Exception {
        // 直接调用writeReplace
        Method writeReplace = func.getClass().getDeclaredMethod("writeReplace");
        writeReplace.setAccessible(true);
      	//反射调用
        Object sl = writeReplace.invoke(func);
        java.lang.invoke.SerializedLambda serializedLambda = (java.lang.invoke.SerializedLambda) sl;
        return serializedLambda;
    }
}

输出结果：可以看到获取到了方法名和类名。知道方法名再去掉get/set前缀就是字段名称了

方法名：getFieldA
类名：xyz/xiezc/ioc/starter/orm/lambda/LambdaTest
serializedLambda：{"implMethodName":"getFieldA","implClass":"xyz/xiezc/ioc/starter/orm/lambda/LambdaTest","functionalInterfaceClass":"xyz/xiezc/ioc/starter/orm/lambda/SFunction","capturingClass":"xyz/xiezc/ioc/starter/orm/lambda/LambdaTest","instantiatedMethodType":"(Lxyz/xiezc/ioc/starter/orm/lambda/LambdaTest;)Ljava/lang/String;","functionalInterfaceMethodSignature":"(Ljava/lang/Object;)Ljava/lang/Object;","implMethodSignature":"()Ljava/lang/String;","functionalInterfaceMethodName":"apply","implMethodKind":5}

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

LambdaQueryWrapper的实现原理分析和lambda的序列化问题