又一巨头从Java迁移到Kotlin:关键应用全部开始切换、安卓代码库超过千万行Kotlin代码

2022 年 10 月 26 日 InfoQ

编译|燕珊,核子可乐
Meta 现在爱 Kotlin 多于 Java。

Facebook 母公司 Meta 正在将其 Android 应用的 Java 代码迁移到 Kotlin。根据 Meta 的官方博客所述,截至今天,其 Android 代码库已经有超过 1000 万行 Kotlin 代码,旗下包括 Facebook、Instagram、Messenger、Portal 和 Quest 在内的应用都已经开始从 Java 转向 Kotlin。

将代码库转换为 Kotlin

Kotlin 是一种更年轻的编程语言,也依赖于 Java 虚拟机。Kotlin 由软件工具制造商 JetBrains 创建,于 2011 年首次亮相,2016 年发布 1.0 版本。次年,它被 Google 采用为 Android 开发的一级语言,并由其基金会管理,该基金会由 JetBrains 和 Google 资助。

到 2019 的 Google I/O 大会,Google 正式宣布,Kotlin 编程语言已成为 Android 应用开发人员的首选语言,并在当年年底表示前 1000 个 Android 应用程序中有近 60% 包含 Kotlin 代码。

从 Google 自身来看,明面上它说自己选择 Kotlin 的理由是它更简洁、更安全、支持结构化并发,能更轻松地编写异步代码,并且可以与 Java 互操作。不过,另一个业界推测是可能跟那宗与 Oracle 旷日持久的 Java 侵权案有关—— Oracle 花了十多年的时间追究 Google 在 Android 中使用 Java API 的侵权索赔,最终 Oracle 败诉。

回到 Meta,Facebook 软件工程师 Omer Strulovich 对选择 Kotlin 如此解释道:“Kotlin 通常被认为是一种比 Java 更好的语言,在年度 Stack Overflow 开发人员调查中,其受欢迎程度高于 Java,”他还指出,由于近年来 Kotlin 已成为 Android 开发的流行语言,“因此,在努力使我们的开发工作流程更加高效的过程中,我们在 Meta 的安卓开发中转向 Kotlin 是非常合理的……”

除了受欢迎之外,Meta 认为 Kotlin 拥有的主要优势包括可空性、函数式编程、代码更短、以及领域特定语言(DSL)等等。

不过,Strulovich 指出,过渡到 Kotlin 也有一些不可忽视的缺点,比如混合代码库可能难以维护,以及 Kotlin 虽然流行,但与 Java 相比还是有比较大的差距,工具集还不够成熟。所有 Kotlin 工具都需要考虑 Kotlin 和 Java 的互操作性,这使得它们的实现变得复杂。

但 Meta 最大的担忧还是构建时间。“我们从一开始就知道 Kotlin 的构建时间会比 Java 的要长。该语言及其生态系统更加复杂,Java 在优化其编译器方面领先了 20 年。由于我们拥有多个大型应用程序,较长的构建时间可能会对我们的开发人员体验产生负面影响。”

为什么不只用 Kotlin 来写新代码

Strulovich 没有透露 Meta 何时开始这种转变。Meta 本来可以选择只用 Kotlin 编写新代码,但它最终还是决定将所有的 Android 应用程序都转换过来。

根据 Strulovich 的说法,如果是只使用 Kotlin 来编写新代码,继续保留大部分现有 Java 代码的话,工作量明显更低,但相应的也有两个缺点:首先就是要在 Kotlin 和 Java 代码之间实现互操作性,就需要引入 Kotlin 中的 platform 类型。Platform 类型会导致运行时中的空指针取消引用,进而引发崩溃,这就破坏了纯 Kotlin 代码提供的静态安全优势。在某些复杂情况下,Kotlin 的空检查省略可能会漏掉空值,意外引发空指针异常。例如,如果 Kotlin 代码调用由 Java 接口实现的 Kotlin 接口,就会发生这种情况。其他的问题还包括 Java 无法将类型参数标记为可空(最近才刚刚修复);Kotlin 的重载规则考虑到了可空性,Java 的重载规则却没有考虑到。

第二个缺点是,这种方式要求对 Meta 已经开发的大多数软件进行代码修改。如果继续把大部分代码保留为 Java 形式,那开发人员就没法充分发挥 Kotlin 的优势。

Kotlin 迁移大法

如今,Meta 旗下的 Android 版 Facebook、Messenger 和 Instagram 应用都拥有超过百万行 Kotlin 代码,而且转换率也一路走高。纵观整个 Android 代码库,其中的 Kotlin 代码量已经超过千万行。

起步阶段

事实上,在尝试为现有应用程序引入 Kotlin 时,Meta 遇到了不少麻烦。例如,团队得更新 Redex 才能支持 Java 无法生成的字节码模式。另外,其使用的某些内部库要求在编译期间进行字节码转换来获取更好的性能。而在将这些库纳入 Kotlin 编译过程时,这部分代码无法正常起效。为此,Meta 针对这些问题构建了专门的解决工具。

Meta 还发现,现有工具之间存在不少冲突。例如,代码审查和 wiki 工具无法对 Kotlin 语法进行高亮显示。“我们还更新了之前使用的 Pygments 库,确保其体验与处理 Java 代码时一致。我们更新了一些内部代码修改工具,使其能够支持 Kotlin。我们也构建了 Ktfmt,一款基于 google-java-format 编码理念的确定性 Kotlin 格式化程序。”

迁移加速阶段

在工具准备齐全之后,Meta 现在已经能将代码中的任意部分转换为 Kotlin。但每次迁移都需要大量样板设计工作,只能由员工们手动完成。J2K 是一种通用工具,并不会去理解所转换的代码是在表达什么。因此,某些特定部分就只能进行手动调整。

最典型的例子就是 Junit 测试规则的使用。假设使用 ExpectedException 规则,来验证是否抛出了正确的异常:

@Rule public ExpectedException expectedException = ExpectedException.none();

当 J2K 将这部分代码转换成 Kotlin 时,得到的就是:

@Rule var expectedException = ExpectedException.none()

这段代码乍看之下与原先的 Java 代码等价,但由于 Kotlin 使用了 site 注解,所以其实际上等价于:

@Rule private ExpectedException expectedException = ExpectedException.none();
public ExpectedException getExpectedException() { return expectedException}

尝试运行后,此测试会失败并返回一个错误:“The @Rule expectedException must be public”,这是因为 Junit 发现了一条带有 @Rule 注解的私有字段。这是个常见问题,论坛上面也已经有成熟答案:要么在字段中添加“@JvmField”;要么在注解中添加注解 use-site,也就是“@get:Rule”:

// 方案一:使用“get”作为注解的use-site@get:Rule var expectedException = ExpectedException.none()
// 方案二:只为没有getter的Java字段生成JVM代码@JvmField @Rule var expectedException = ExpectedException.none()

由于 J2K 无法(可能也不应该)感知 JUnit 的复杂性,所以没能正确完成转换。但即使 JUnit 不存在这个问题,J2K 在处理其他小众框架的时候也肯定会掉类似的坑。

例如,很多 Android Java 代码会使用 android.text.TextUtils 中的实用方法,例如 isEmpty,来简化对某些字符串的检查。但在 Kotlin 中,其实是有内置的标准库方法 String.isNullOrEmpty 的。该方法之所以更好,是因为它能通过契约来告知 Kotlin 编译器如果它返回 false,则被测试的对象不得再为 null,并将其智能转换为 String。

Java 代码也有不少类似的辅助方法,也有很多库都实现了相同的基本方法。这一切都需要替换成标准的 Kotlin 方法,借此简化代码并保证编译器能正确检测出不可为空的类型。

Strulovich 表示,内部发现了许许多多类似的小小修复实例。有些难度不大(例如替换 isEmpty),有些则需要研究一番才能搞明白(例如 JUnit 规则)。还有一些其实属于 J2K 出的错,可能导致构建错误、运行时行为错乱等问题。

为了解决这些问题,Meta 团队将 J2K 转换流程划分成三个步骤:

  1. 首先,取一个 Java 包并准备将其转换为 Kotlin。这个步骤主要解决错误,并完成相应的内部工具转换。

  2. 第二步就是运行 J2K。团队已经能够以无头模式运行 Android Studio 并调用 J2K,由此将整个管道作为脚本来运行。

  3. 最后一步,对新的 Kotlin 文件进行后处理。具体包括大部分自动重构与修复步骤,例如将 JUnit 规则标记为 @JvmField。在此步骤中,团队还应用了自动更新 linter,并在无头模式下应用各种 Android Studio 建议。

“当然,自动化并不足以解决所有问题,但至少能帮我们优先处理那些最常见的问题。”Strulovich 说。

在 Java 重构方面,Meta 使用的是 JavaASTParser 等工具,它能帮助解析某些类型。而在 Kotlin 这边,团队还没有找到能够解析类型的好办法,所以选择使用 Kotlin 编译器 API。

Meta 还发布了一组自动重构方法(https://github.com/fbsamples/kotlin_ast_tools)。虽然不是很多,但希望能帮助更多开发者利用 Kotlin 编译器解析器高效完成工作。

下一步

平均而言,Meta 发现迁移后的代码行数减少了 11%。尽管网上各种案例引用的数字往往要比这高得多,但他们还是对这个数字感到满意。

Strulovich 说,Meta 向 Kotlin 的迁移仍在进行中并在加速。“Kotlin 仍然缺乏一些我们在使用 Java 时已经习惯了的工具和优化,但我们正在努力缩小这些差距。随着我们取得的进展和这些工具和库的成熟,我们也将努力把它们反馈给社区。”

参考链接:

https://www.theregister.com/2022/10/25/meta_java_kotlin/

https://engineering.fb.com/2022/10/24/android/android-java-kotlin-migration/

声明:本文为InfoQ翻译,未经许可禁止转载。

今日好文推荐

中国开发者整体规模 2016.37万,企业服务成为热门“移民”行业| InfoQ《开发者画像洞察研究报告 2022》发布

让小型企业提高 20 倍效率的统一技术栈

60 岁周星驰招聘 Web3.0 人才,要求“宅心仁厚”;马斯克计划裁掉推特 75% 的员工;Linus 致开发者:不要再熬夜了 | Q 资讯

可能是最严重的云存储数据外泄事故之一:微软承认服务器错误配置导致全球客户数据泄露

活动推荐

11 月 25 日 -26 日,QCon 上海站即将在线下与大家见面。元宇宙实践、LakeHouse 落地、金融科技、智能汽车、API 治理等十余个热门技术专题,50+ 大厂专家技术案例现场分享,点击底部【阅读原文】直达大会官网,查看更多精彩内容。

大会门票 9 折优惠最后 10 天!下单立减 680 元,感兴趣的同学,联系票务经理:+86 18514549229(同微信)

登录查看更多
0

相关内容

Kotlin 是一种运行于 Java 虚拟机上的静态类型编程语言。
《Julia数据科学》及代码,166页pdf
专知会员服务
47+阅读 · 2021年11月4日
【干货书】C++实战编程指南,附549页pdf与Slides
专知会员服务
82+阅读 · 2021年4月23日
【硬核书】Linux核心编程|Linux Kernel Programming,741页pdf
专知会员服务
78+阅读 · 2021年3月26日
【2020新书】Ruby 3 编程: 从小白到专家,598页pdf
专知会员服务
29+阅读 · 2020年12月17日
放弃 SVN,苹果 WebKit 迁移到 GitHub
InfoQ
0+阅读 · 2022年9月6日
Meta在服务器端用了哪些编程语言?
InfoQ
0+阅读 · 2022年7月29日
2022 年 Java 将何去何从?
AI前线
0+阅读 · 2022年4月11日
我们将40万行代码从Flow迁移到了TypeScript
Kotlin,竟然这么香!| 极客时间
InfoQ
0+阅读 · 2022年1月5日
使用 Kotlin 重写 AOSP 日历应用
谷歌开发者
0+阅读 · 2021年9月15日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
12+阅读 · 2020年12月10日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
11+阅读 · 2018年7月8日
VIP会员
相关资讯
放弃 SVN,苹果 WebKit 迁移到 GitHub
InfoQ
0+阅读 · 2022年9月6日
Meta在服务器端用了哪些编程语言?
InfoQ
0+阅读 · 2022年7月29日
2022 年 Java 将何去何从?
AI前线
0+阅读 · 2022年4月11日
我们将40万行代码从Flow迁移到了TypeScript
Kotlin,竟然这么香!| 极客时间
InfoQ
0+阅读 · 2022年1月5日
使用 Kotlin 重写 AOSP 日历应用
谷歌开发者
0+阅读 · 2021年9月15日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员