AI 智能体(AI Agents)的兴起正在深刻变革软件构建范式。智能体的前景在于:开发者能够以更快的速度编写代码,将多项任务委派给不同的智能体,甚至仅通过自然语言即可构建完整的软件系统。然而在现实中,智能体在专业软件开发中究竟扮演何种角色仍是一个悬而未决的问题。 本研究调查了资深开发者在构建软件时利用智能体的方式,涵盖了其动机、策略、任务适配度以及主观评价。通过现场观察($N=13$)与定性调研($N=99$),我们发现:尽管资深开发者认可智能体带来的生产力提升,但出于对软件质量属性(Quality Attributes)这一基本原则的坚持,他们仍通过各种策略来控制智能体行为,并利用自身专业经验在软件设计与实现中保持主体性(Agency)。 此外,资深开发者对于将智能体融入软件开发流程总体持积极态度,这源于他们有信心利用自身专业能力弥补智能体的局限性。本研究结果阐明了软件开发最佳实践在有效使用智能体中的价值,识别了适合智能体执行的任务类型,并为未来优化智能体交互界面及制定智能体使用指南提供了方向。

1 引言(Introduction)

“我已经做了 20 年的软件开发和数据分析,我绝不可能再回到纯手工编写代码的时代了。那样的日子已经一去不复返,谢天谢地。” —— 本研究受访开发者(S28) 人工智能正在迅速改变编程实践。目前,约有半数专业软件开发者在日常工作中使用 AI 工具 [30]。大语言模型(LLMs)在代码编写方面表现尤为出色,且能力逐年递增。起初在 2021 年,LLMs 仅作为“增强型自动补全”提供编程辅助 [12]。但近期,其能力已进化至能够以自主、分步行动的方式访问、修改和测试整个代码库——我们现已进入**智能体化编程(Agentic Coding)**时代。 关于这些智能体的能力上限以及如何最佳地使用它们,目前仍存在许多未解之谜。从轶闻证据看,我们偶尔会听到有人尝试一次后发现效果不佳。但与此同时,社交媒体上的言论却大相径庭:一些在线用户声称能同时使用数十个智能体自主构建大型软件(例如 [32, 41]),这种说法虽然极具吸引力,但因其潜在的不可信性而遭到了嘲讽 [16]。 真实情况究竟如何?

关于智能体化编程的用户研究正在兴起,但仍然稀缺。一项显著的随机对照试验发现,资深开源维护者在允许使用 AI 时,其速度反而降低了 19% [4];而在一项部署于问题追踪器(Issue Tracker)中的智能体系统研究中,仅有 8% 的调用最终获得了成功(即合并了 Pull Request)[31]。这些结果表明,智能体化 AI 或许并不像初听起来那么有用,但仍有约四分之一的专业开发者报告称,他们每周至少会使用一次 AI 智能体 [30]。 近期有一些研究 [9, 11, 27, 29] 调查了所谓的**“氛围编程(Vibe Coding)”** [17]。虽然该术语有时被泛指任何使用 AI 智能体进行的编程,但这些论文将“氛围编程”定义为一种特定的智能体使用形式:它追求一种“流畅与愉悦”的体验,倾向于信任 AI 而非仔细审查生成的代码 [27],“完全沉浸在感觉(Vibes)中”,“忘掉代码的存在”,并且“不再阅读代码差异(Diffs)” [17]。 从业者心照不宣地承认,这种“氛围感”产出的代码质量较低 [9]。因此,氛围编程可能并非智能体化编程最成功的路径,也未必是资深开发者的用法。那么,资深开发者究竟如何利用 AI 智能体创建高质量软件?

本文旨在深入洞察专家在智能体化编程中的当前实践,以理解哪些方法奏效、哪些不奏效。与以往研究相比,我们 (a) 不局限于调查氛围编程,且 (b) 仅考察资深开发者,期望凭借其专业能力,对现实应用中的智能体工具提出具有洞察力的批判性见解。我们开展了一项由两部分组成的研究——13 场现场观察和针对 99 名资深开发者的广泛问卷调查——旨在回答四个研究问题(RQs): * RQ1 - 动机: 资深开发者将智能体融入软件开发工作流时,最看重什么? * RQ2 - 策略: 资深开发者在使用智能体开发软件时采用了哪些策略? * RQ3 - 适配度: 软件开发智能体适合哪些任务?在何时会失效? * RQ4 - 评价: 资深开发者在使用智能体工具时持有怎样的情感态度?

我们最显著的发现是:专业开发者确实不进行“氛围编程”。 相反,他们通过规划和监督来严格控制智能体。具体而言:他们追求生产力的提升,但仍坚守软件质量属性(RQ1);他们在实施前进行规划,并验证智能体的所有输出(RQ2);他们认为智能体适用于描述清晰、简单的任务,而非复杂任务(RQ3);尽管如此,只要处于“掌控”地位,他们通常很享受使用智能体(RQ4)。 本文其余部分结构安排如下:第 2 节介绍两阶段研究的方法论;第 3 节详细阐述研究发现,并在第 4 节进行总结;第 5 节讨论研究结果的影响;第 6 节回顾相关工作;第 7 节总结全文。

成为VIP会员查看完整内容
0
微信扫码咨询专知VIP会员