用了那么久的Lombok，你知道它的原理么？

2022 年 8 月 11 日 阿里技术

序言

在写Java代码的时候，最烦写setter/getter方法，自从有了Lombok插件不用再写那些方法之后，感觉再也回不去了，那你们是否好奇过Lombok是怎么把setter/getter方法给你加上去的呢？有的同学说我们Java引入Lombok之后会污染依赖包，那我们可不可以自己写一个工具来代替Lombok呢？

知识点

Java编译过程
了解Lombok原理
了解插入式注解处理器

分析

序言提到的问题其实都是同一个问题，就是如何去获取和修改Java源代码？

要回答这个问题，我们需要回答这几个问题：

Java编译器是如何解析Java源代码的？
编译器编译源代码都有哪些步骤？
我们在编译器工作的时候，怎么才能去增加内容或者是进行代码分析？

希望大家看完本文能够自己写一个简易的Lombok工具。

回答

如何解析源代码

其实从我们的代码到被编译，中间隔了一个数据结构，叫做AST（抽象树）。具体的形式，可以查看下面的图片。右边的便是AST的数据结构了。

代码编译都有哪些步骤

整个编译过程大致如下：

图片来自openjdk

1.初始化插入注解处理器

2.解析与填充符号表过程

a.词法分析、语法分析。将源代码的字符流转变为标记集合，构造出抽象语法树。

b.填充符号表。产生符号地址和符号信息。

3.插入式注解处理器的注解处理过程：插入式注解处理器的执行阶段。后面我会给大家带来两个此方面的实用实战例子。

4.分析与字节码生成过程

a. 标注检查。对语法的静态信息检查。

b. 数据流及控制流分析。对程序动态运行过程进行检查。

c. 解语法糖。将简化代码编写的语法糖还原为原有的形式。

d. 字节码生成。将前面各个步骤所生成的信息转化成为字节码。

我们知道了上面的理论之后，接下来我们进行实战。带着大家一起去修改AST（抽象树）。添加自己的代码。

实战

如何自己实现一个自动添加Setter/Getter的工具

首先，我们创建一个自己的注解。

@Retention(RetentionPolicy.SOURCE) // 注解只在源码中保留@Target(ElementType.TYPE) // 用于修饰类public @interface MySetterGetter {}

创建一个需要生成setter/getter方法的实体类

@MySetterGetter  // 打上我们的注解public class Test {    private String wzj;}

接下来就来看一看如何来生成我们想要的字符串。

整体代码如下：

@SupportedAnnotationTypes("com.study.practice.nameChecker.MySetterGetter")@SupportedSourceVersion(SourceVersion.RELEASE_8)public class MySetterGetterProcessor extends AbstractProcessor {    // 主要是输出信息    private Messager messager;    private JavacTrees javacTrees;
    private TreeMaker treeMaker;    private Names names;    @Override    public synchronized void init(ProcessingEnvironment processingEnv) {        super.init(processingEnv);        this.messager = processingEnv.getMessager();        this.javacTrees = JavacTrees.instance(processingEnv);        Context context = ((JavacProcessingEnvironment)processingEnv).getContext();        this.treeMaker = TreeMaker.instance(context);        this.names = Names.instance(context);    }
    @Override    public boolean process(Set<? extends TypeElement> annotations, RoundEnvironment roundEnv) {        // 拿到被注解标注的所有的类        Set<? extends Element> elementsAnnotatedWith = roundEnv.getElementsAnnotatedWith(MySetterGetter.class);        elementsAnnotatedWith.forEach(element -> {            // 得到类的抽象树结构            JCTree tree = javacTrees.getTree(element);            // 遍历类，对类进行修改            tree.accept(new TreeTranslator(){                @Override                public void visitClassDef(JCTree.JCClassDecl jcClassDecl) {                    List<JCTree.JCVariableDecl> jcVariableDeclList = List.nil();                    // 在抽象树中找出所有的变量                    for(JCTree jcTree: jcClassDecl.defs){                        if (jcTree.getKind().equals(Tree.Kind.VARIABLE)){                            JCTree.JCVariableDecl jcVariableDecl = (JCTree.JCVariableDecl)jcTree;                            jcVariableDeclList = jcVariableDeclList.append(jcVariableDecl);                        }                    }                                        // 对于变量进行生成方法的操作                    for (JCTree.JCVariableDecl jcVariableDecl : jcVariableDeclList) {                        messager.printMessage(Diagnostic.Kind.NOTE, jcVariableDecl.getName() + " has been processed");                        jcClassDecl.defs = jcClassDecl.defs.prepend(makeSetterMethodDecl(jcVariableDecl));
                        jcClassDecl.defs = jcClassDecl.defs.prepend(makeGetterMethodDecl(jcVariableDecl));                    }

        // 生成返回对象        JCTree.JCExpression methodType = treeMaker.Type(new Type.JCVoidType());
        return treeMaker.MethodDef(treeMaker.Modifiers(Flags.PUBLIC), getNewSetterMethodName(jcVariableDecl.getName()), methodType, List.nil(), parameters, List.nil(), block, null);    }    /**     * 生成 getter 方法     * @param jcVariableDecl     * @return     */    private JCTree.JCMethodDecl makeGetterMethodDecl(JCTree.JCVariableDecl jcVariableDecl){        ListBuffer<JCTree.JCStatement> statements = new ListBuffer<>();        // 生成表达式        JCTree.JCReturn aReturn = treeMaker.Return(treeMaker.Ident(jcVariableDecl.getName()));        statements.append(aReturn);        JCTree.JCBlock block = treeMaker.Block(0, statements.toList());        // 无入参        // 生成返回对象        JCTree.JCExpression returnType = treeMaker.Type(jcVariableDecl.getType().type);        return treeMaker.MethodDef(treeMaker.Modifiers(Flags.PUBLIC), getNewGetterMethodName(jcVariableDecl.getName()), returnType, List.nil(), List.nil(), List.nil(), block, null);    }    /**     * 拼装Setter方法名称字符串     * @param name     * @return     */    private Name getNewSetterMethodName(Name name) {        String s = name.toString();        return names.fromString("set" + s.substring(0,1).toUpperCase() + s.substring(1, name.length()));    }    /**     * 拼装 Getter 方法名称的字符串     * @param name     * @return     */    private Name getNewGetterMethodName(Name name) {        String s = name.toString();        return names.fromString("get" + s.substring(0,1).toUpperCase() + s.substring(1, name.length()));    }    /**     * 生成表达式     * @param lhs     * @param rhs     * @return     */    private JCTree.JCExpressionStatement makeAssignment(JCTree.JCExpression lhs, JCTree.JCExpression rhs) {        return treeMaker.Exec(                treeMaker.Assign(lhs, rhs)        );    }}

代码有点多，我们逐一拆解说明：

下面这是整个代码结构的脑图，后面的讲解会基于这个顺序。

a. 注解

@SupportedAnnotationTypes 表示我们需要监听的注解，比如我们之前定义的 @MySetterGetter 。

@SupportedSourceVersion 表示我们想要对什么版本的Java源代码进行处理。

b. 父类

AbstractProcessor是本次的核心类，编译器在编译的时候会扫描此类的子类。其中有一个子类必须实现的核心方法 public boolean process(Set<? extends TypeElement> annotations, RoundEnvironment roundEnv)，此方法如果是返回为true就说明编译的那个类抽象树的结构又变化，需要重新进行词法分析和语法分析（可以查看上面提到的那个编译流程图）。如果返回的是false就说明没有变化。

c. process方法

主要的操作逻辑是：

1.拿到所有被我们MySetterGetter标注的类。

2.遍历所有的类，生成类的抽象树结构。

3.对类进行操作：

a. 找到类中所有的变量。

b. 对变量进行生成Set和Get方法。

4.返回 true，说明类结构变了，需要重新解析。如果是false说明没有变，不用重新解析。

d. 操作JCTree树

主要是在操作抽象树，可以查看文末附件中的文章进行学习。

e. 方法名称拼接

这一块儿和字符串拼接没啥区别，用过反射的同学应该也都清楚这个操作了。

到此为止，我们就已经介绍完了Lombok的原理。怎么样是不是很简单。接下来，就让我们把它运行起来，投入到实战之中。

f. 运行

最后来看一下如何正确的运行这个我们写的工具。

1. 环境

我的系统环境是 macOs Monterey；

java版本是

openjdk version "1.8.0_302"OpenJDK Runtime Environment (Temurin)(build 1.8.0_302-b08)OpenJDK 64-Bit Server VM (Temurin)(build 25.302-b08, mixed mode)

2. 编译processor

在你存放 MySetterGetter 和 MySetterGetterProcessor 两个类的目录下进行编译。

javac -cp $JAVA_HOME/lib/tools.jar MySetterGetter.java MySetterGetterProcessor.java

执行成功后会出现这三个class文件。

3. 声明插入式注解处理器

1.在你的工程的resources下面创建一个包，名称为：META-INFO.services

2.然后创建一个文件，名称为：javax.annotation.processing.Processor

3. 将你的注解处理器的地址填入，我的配置是这样的：

c om.study.practice.nameChecker.MySetterGetterProcessor

4. 用我们的工具去编译目标类

比如我们本次是要编译那个test.java。

它的内容再回顾一下：

@MySetterGetter  // 打上我们的注解public class Test {    private String wzj;}

然后我们就去编译它（注意类前面的路径。这个你们得换成自己的工程目录。）

javac -processor com.study.practice.nameChecker.MySetterGetterProcessor com/study/practice/nameChecker/Test.java

执行之后如果没有修改我的代码的话会打印这几个字符串：

process 1process 2注: wzj has been processedprocess 1

最后会生成Test.class文件。

5. 成果

最后的class文件解析出来就是这个样子的。如下图所示：

看到Setter/Getter方法就说明我们已经大功告成了！是不是很简单。

到此为止，我们就学会了如何自己写一个属于自己的简易Lombok的插件了。

附件

treemarker 的介绍:

http://www.docjar.com/docs/api/com/sun/tools/javac/tree/TreeMaker.html

ModelScope开源模型社区评测征集令

ModelScope开源模型社区评测专场重磅来袭，发布你的评测，免费使用模型库搭建属于你的应用，有机会获得AirPods和阿里云定制礼品，更有多重福利点击链接查看活动详情。

登录查看更多

相关内容

Java

关注 1507

Java 是一门编程语言，拥有跨平台、面向对象、泛型编程等特性。

Neo4j知识图谱的技术解析及案例分享

专知会员服务

49+阅读 · 2022年7月15日

【干货书】Python参考手册，210页pdf

专知会员服务

64+阅读 · 2021年4月30日

【干货书】Python 自动化的乐趣｜搞定重复琐碎& 单调无聊的工作(中文版)

专知会员服务

44+阅读 · 2021年2月17日

【2020新书】如何写出简洁Python代码，321页pdf

专知会员服务

93+阅读 · 2020年12月26日

【2020干货书】Python3基础导论介绍,98页pdf

专知会员服务

103+阅读 · 2020年10月11日

【2020新书】使用SAS Studio学习数据科学，这是一个快速入门指南

专知会员服务

17+阅读 · 2020年10月2日

AlphaZero原理与启示

专知会员服务

33+阅读 · 2020年8月23日

Query2box: 使用盒嵌入对向量空间中的知识图谱进行推理，Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings

专知会员服务

46+阅读 · 2020年5月11日

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

325+阅读 · 2020年3月6日

C++17是什么？看这本最新指南书册《C++17标准语言新特性》109页pdf

专知会员服务

69+阅读 · 2020年2月23日

Java8 Lambda实现源码解析

阿里技术

2+阅读 · 2022年11月22日

一个注解搞定责任链，学还是不学？

阿里技术

0+阅读 · 2022年9月27日

24 年了，终于有人发现 curl 的这个 Bug 了

InfoQ

0+阅读 · 2022年9月24日

10 个数据分析师必须知道的 SQL 查询语法

CSDN

0+阅读 · 2022年9月13日

是Rust太难了，还是主流编程本来就这么折磨人？

InfoQ

0+阅读 · 2022年6月6日

在IDEA中，你也可以发布自己的插件！

CSDN

0+阅读 · 2022年1月28日

Flutter 里的语法糖解析，知其所然方能潇洒舞剑 | 开发者说·DTalk

谷歌开发者

0+阅读 · 2022年1月14日

自己动手写符合自己业务需求的eslint规则

阿里技术

0+阅读 · 2021年12月7日

一文看懂怎么用 Python 做数据分析

大数据技术

24+阅读 · 2019年5月5日

用Python让蔡徐坤在我的命令行里打篮球！| 附完整代码

七月在线实验室

18+阅读 · 2019年4月25日

模糊收敛群及其在粗糙集中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

解析函数空间上复合算子的缠绕关系和紧差分

国家自然科学基金

0+阅读 · 2013年12月31日

嵌入式控制软件的形式化规格说明构建的工程方法

国家自然科学基金

2+阅读 · 2013年12月31日

微分方程周期解问题的全局收敛性算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

通用型回答集程序关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

LAMOST光谱质量控制和检查系统的软件实现和关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

光催化分解水制取氢气的Ag/TiO2组装结构基于表面等离子体光子学原理的两种设计

国家自然科学基金

0+阅读 · 2012年12月31日

提高程序验证自动化程度的技术

国家自然科学基金

0+阅读 · 2011年12月31日

作用于SMAD3的RNA干扰的靶位点筛选、构建及其对肝纤维化作用研究

国家自然科学基金

0+阅读 · 2008年12月31日

基于抽象解释的逻辑程序验证研究

国家自然科学基金

1+阅读 · 2008年12月31日

Peekaboo: Text to Image Diffusion Models are Zero-Shot Segmentors

Arxiv

0+阅读 · 2022年11月23日

Fixpoints and relative precompleteness

Arxiv

0+阅读 · 2022年11月23日

CANDLE: Decomposing Conditional and Conjunctive Queries for Task-Oriented Dialogue Systems

Arxiv

0+阅读 · 2022年11月23日

Predicting the Type and Target of Offensive Social Media Posts in Marathi

Arxiv

0+阅读 · 2022年11月22日

KnowGL: Knowledge Generation and Linking from Text

Arxiv

0+阅读 · 2022年11月22日

A Recursively Recurrent Neural Network (R2N2) Architecture for Learning Iterative Algorithms

Arxiv

0+阅读 · 2022年11月22日

Design and control of a collision-resilient aerial vehicle with an icosahedron tensegrity structure

Arxiv

0+阅读 · 2022年11月22日

ArzEn-ST: A Three-way Speech Translation Corpus for Code-Switched Egyptian Arabic - English

Arxiv

0+阅读 · 2022年11月22日

Diffusion Models in Vision: A Survey

Arxiv

30+阅读 · 2022年9月10日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

VIP会员