The increasing complexity of software supply chains and the rise of supply chain attacks have elevated concerns around software integrity. Users and stakeholders face significant challenges in validating that a given software artifact corresponds to its declared source. Reproducible Builds address this challenge by ensuring that independently performed builds from identical source code produce identical binaries. However, achieving reproducibility at scale remains difficult, especially in Java, due to a range of non-deterministic factors and caveats in the build process. In this work, we focus on reproducibility in Java-based software, archetypal of enterprise applications. We introduce a conceptual framework for reproducible builds, we analyze a large dataset from Reproducible Central, and we develop a novel taxonomy of six root causes of unreproducibility. We study actionable mitigations: artifact and bytecode canonicalization using OSS-Rebuild and jNorm respectively. Finally, we present Chains-Rebuild, a tool that achieve successfulcanonicalization for 26.60% on 12,803 unreproducible artifacts To sum up, our contributions are the first large-scale taxonomy of build unreproducibility causes in Java, a publicly available dataset of unreproducible builds, and Chains-Rebuild, a canonicalization tool for mitigating unreproducible builds in Java.


翻译:软件供应链日益复杂及供应链攻击的兴起,加剧了人们对软件完整性的担忧。用户和利益相关方在验证特定软件制品是否与其声明的源代码一致方面面临重大挑战。可重现构建通过确保基于相同源代码的独立构建能产生相同的二进制文件来应对这一挑战。然而,由于构建过程中存在一系列非确定性因素和注意事项,大规模实现可重现性仍然困难,尤其在Java生态中。本研究聚焦于企业级应用典型代表的Java软件的可重现性问题。我们提出了一个可重现构建的概念框架,分析了来自Reproducible Central的大规模数据集,并建立了六类不可重现性根本原因的新分类体系。我们研究了可行的缓解方案:分别使用OSS-Rebuild和jNorm进行制品与字节码规范化。最后,我们提出了Chains-Rebuild工具,该工具在12,803个不可重现制品上实现了26.60%的成功规范化率。总结而言,我们的贡献包括:首个Java构建不可重现性原因的大规模分类体系、公开可用的不可重现构建数据集,以及用于缓解Java不可重现构建的规范化工具Chains-Rebuild。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
论文报告 | Graph-based Neural Multi-Document Summarization
科技创新与创业
15+阅读 · 2017年12月15日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
VIP会员
相关资讯
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员