AI也能种黄瓜了，你想尝尝吗？

2019 年 1 月 9 日 微软研究院AI头条

编者按：在由荷兰瓦格宁根大学与研究中心主办的自动化温室挑战赛中，来自微软研究院的Sonoma团队取得了第一名的成绩。他们开发的AI代理利用基于模型的近似贝叶斯强化学习并借助相关领域专家的专业知识，在净利润值指标上，超越了作为对标参考的人类种植专家。本文编译自微软研究院博客文章Competition win a steppingstone in the greater journey to create sustainable farming。

为了应对不断增长的世界人口对传统粮食生产方法所带来的挑战，荷兰瓦格宁根大学与研究中心（Wageningen University & Research）和企业赞助商腾讯公司在2018年共同举办了一项利用人工智能技术种植黄瓜的国际“自动化温室挑战赛”，希望可以打造一个无需现场专业人员看管即可自行运转的“未来温室”。主办方要求参赛者利用人工智能对黄瓜种植进行远程操作，在最大限度提高黄瓜产量的同时，把资源消耗降到最低。

来自瓦格宁根大学与研究中心、腾讯、英特尔、Delphy & AgroEnergy、微软等公司的多个团队参加了此次比赛。赛事主办方在位于荷兰布莱斯韦克（Bleiswijk）市的荷兰瓦格宁根大学与研究中心校园内为每个团队分配了96平方米的温室空间，每个温室都配备着完全相同的系统，包括通风、加热和人工照明，以及用于测量温度、湿度和能量消耗的传感器等装备。各参赛队伍只被允许进入其指定的温室一次，安装各自需要的额外传感器和监测设备，其它时间里，他们只能远程运行各自的AI系统。

比赛的评分标准包含三个部分：净利润额、算法性能、以及资源使用效率。其中，净利润额所占的权重最大（50%）；算法新颖性和性能占30％；而根据能源、水、二氧化碳和农药使用计算得出的效率指标则占20％。

最终，由微软研究院首席研究工程师Kenneth Tran带领的Sonoma团队所开发的系统以净利润值超出第二名25%的成绩赢得了比赛，并在综合可持续性方面也被赛事评审评选为最优方案。他们创下的记录是每平方米温室的黄瓜产量超过55千克、净利润25欧元。在净利润值的指标上，Sonoma团队甚至超越了作为对标参考的人类专家种植者，净利润高出了17％。这是全球范围内首次实现远程AI控制下的温室黄瓜栽培。

Sonoma团队成员——Thomas Follender Grossfeld, Kenneth Tran, Chetan Bansal, and David Katzin（从左至右）

对于Sonoma团队来说，跟远程采集数据相比，数据采集的方法其实更具挑战性。团队需要设计一整套系统来应对墨菲定律——“任何可能出错的地方一定会出错”。所有的数据是从传感器盒、摄像头、温室所用的API等多个来源采集到的，这些数据源都有可能出现故障，而在实际比赛过程中也确实发生了故障。所以，比赛的关键就在于你是否能够及时检测到故障，并且快速做出反应。其实，这些故障也是实际生产环境中会碰到的问题。所以，他们必须要能够设计出一个可以有效解决这些问题的系统。

Sonoma的AI方法论

在AI系统框架的搭建上，Sonoma团队选择基于模型的近似贝叶斯强化学习（RL），因为这一方法具有较高的样本效率，并且便于推广。Tran表示：“样本效率对现实世界的应用至关重要。即使在简单环境下，标准的强化学习算法仍需要数以百万计的试验，才可以培训出良好的代理。对于游戏领域而言，这并不是一个问题，一个代理能够随心所欲地玩各种游戏，所以RL在游戏中已经表现得很成功。而在实际应用中（例如黄瓜种植），我们无法承受数百万次的失败尝试，所以我们需要以不同的方式来思考RL。”

为了让强化学习成为能够应对当今粮食问题的可行解决方案，Sonoma团队认为AI代理必须在初始阶段就要像任何现有系统一样强大，并能够随着时间推移不断学习和改进。团队构思了一个能够综合这些特点的框架（见下图）。

这个框架以训练概率动态模型为起点。这种模型学习类似于模拟器构建，它可以帮助AI代理通过“想象”进行规划。此外，通过模仿学习，AI代理在初始阶段就能像现有的专家级策略那样行事。之后，AI代理将在基于模型的策略持续优化过程上运转，通过每次环境交互来提高其整体性能。

在温室挑战赛中，天气条件等来自温室外围的数据，以及来自传感器和温室内部的图像数据都被输入到代理中，接着由后者确定人工照明的强度和分布，给予植物的水分、二氧化碳和养分的量，以及温室温度。所有这些设置的依据都来自于框架对于如何产生最多生物量（biomass）的学习结果。

Sonoma团队成功地将当前关于作物种植和管理以及温室环境控制的最佳知识和实践方法纳入其温室人工智能控制系统中，团队从先前模型数据中确定了从高植株密度系统入手，并根据作物生长期间的作物表现和气象条件调整AI气候控制，以实现这种高密度/高产量系统的最佳性能。

由于比赛规则仅允许一次尝试，而且在赛前相关数据并不多，因此，Sonoma团队采取了保守的、依靠领域专家手工制定的策略。通过与领域专家合作，利用他们的知识以及AI代理的能力，Sonoma团队才能够在短时间内产生较好的结果。

Sonoma团队温室黄瓜自动化种植过程

AI for Earth

对于微软而言，在自动化温室挑战赛中展示的工作只是“人工智能地球计划（AI for Earth）”的一部分，这一计划于2017年7月启动，旨在借助云计算、物联网和AI技术，保护和维持地球及其自然资源，通过资助、培训和深入合作的方式，向水资源、农业、生物多样性和气候变化等领域的个人和组织机构提供支持。该计划涉及的领域和资金支持一直不断扩大，并且已经在数据驱动型农业领域取得了令人印象深刻的进展。

FarmBeats也是这一计划的项目之一，是在户外环境下通过传感器、无人机以及其它设备改进数据采集，提高农业的可持续性；而Sonoma团队的工作则专注于受控环境农业（CEA），这是一种封闭的种植系统，允许种植者配置并实现光照、温度、湿度和二氧化碳浓度等环境因素的最优组合。作为满足地球人口营养需求的更高效、更便利手段之一，CEA将对农业生产带来重大影响。

从2017年开始，Tran对CEA领域就产生了浓厚的研究兴趣，他和同事们一直在探索机器学习技术在现实世界中的应用潜力。而CEA则是强化学习模型的理想训练场所。CEA提供了多种可以利用的受控场景和丰富的数据，由于运用了传感器和物联网等技术手段，数据采集更加便捷。因此，Tran及其同事发起了Sonoma项目（同时也是温室挑战赛团队的名称），他们的应用重点是温室和垂直农业，两者在更安全、更快速地进行粮食生产方面都有着巨大潜力，并且对传统农业的两大基础资源——水分和土壤的消耗更少。根据温室挑战赛官方网站的资料，与传统的农业手段相比，获得相同的收成，温室和垂直农业等室内种植手段仅需消耗十分之一的水资源和土地面积，而且消耗的农药和化肥也较少。

这种极具前景的农业解决方案需要庞大的室内农业专家队伍，但专家队伍的数量远远落后于室内农业发展的需求。因此，Sonoma项目的目标就是利用人工智能帮助农业生产实现自动化管理，这样可以帮助将发达国家（如荷兰）的专业农业知识扩展到发展中国家，同时也可以进一步提升高专家种植者的能力。

为了达到Sonoma项目的目标，Tran采取了“自下而上、自上而下”两种项目实施方法。“自下而上”是指开展底层强化学习的创新研究以及以应用为中心的研究，强化学习的应用型研究尚处于早期阶段，新的研究还有非常大的应用潜力；而“自上而下”则是指寻求与世界各地的领域专家们展开合作，Sonoma项目的成员包括来自微软研究院的AI领域专家，来自加拿大农业和农业食品部（AAFC）的植物学家Xiuming Hao，来自美国俄亥俄州立大学受控环境农业教授Chieri Kubota，以及其他合作者。