在过去的数年,见证了机器学习(ML)和计算机科学领域的许多变化。按照这种长弧形的进步模式,人们或许将在接下来的几年中看到许多令人兴奋的进展,这些进步最终将造福数十亿人的生活,并产生比以往更深远的影响。 在一篇总结文章中,谷歌 AI 负责人、知名学者 Jeff Dean 重点介绍了 2021 年之后机器学习最具潜力的五个领域:
VTN 模型的可视化。它能够提取布局元素(段落、表格、图像等)之间的有意义的联系,以生成逼真的合成文档(例如,具有更好的对齐和边距)。 还有其他机器学习算法已被用于评估机器学习加速器芯片本身的计算机架构决策的设计空间。机器学习可用于为 ASIC 设计快速创建芯片布局,这些布局优于人类专家生成的布局,并且可以在几小时而不是几周内生成。这降低了芯片的固定工程成本,并减少了为不同应用快速创建专用硬件的阻碍。谷歌在即将推出的 TPU-v5 芯片的设计中成功地使用了这种方法。 这种探索性的机器学习方法也已应用于材料发现。在谷歌研究院和加州理工学院的合作中,几个机器学习模型与改进后的喷墨打印机和定制显微镜相结合,能够快速搜索数十万种可能的材料。 这些自动化设计空间探索方法可以帮助加速许多科学领域,特别是当生成实验和评估结果的整个实验循环都能以自动化或大部分自动化的方式完成时。这种方法也许会在未来几年在更多领域中发挥良好的效果。 健康应用 除了推进基础科学,机器学习还可以更广泛地推动医学和人类健康的进步。利用计算机科学在健康方面的进步并不是什么新鲜事,但是机器学习打开了新的大门,带来了新的机会,也带来了新的挑战。 以基因组学领域为例。自基因组学问世以来,计算一直很重要,但机器学习增加了新功能并破坏了旧范式。当谷歌的研究人员开始在这一领域工作时,许多专家认为使用深度学习帮助从测序仪输出推断遗传变异的想法是牵强附会的。而在今天,这种机器学习方法被认为是最先进的。 未来机器学习将扮演更重要的角色,基因组学公司正在开发更准确、更快的新测序仪器,但也带来了新的推理挑战。谷歌发布了开源软件 DeepConsensus,并与 UCSC 、PEPPER-DeepVariant 合作,支持这些前沿信息学的新仪器,希望更快速的测序能够带来对患者产生影响的适用性。 除了处理测序仪数据之外,还有其他机会使用机器学习来加速将基因组信息用于个性化健康的过程。广泛表型和测序个体的大型生物库可以彻底改变人类理解和管理疾病遗传易感性的方式。谷歌基于机器学习的表型分析方法提高了将大型成像和文本数据集转换为可用于遗传关联研究的表型的可扩展性,DeepNull 方法更好地利用大型表型数据进行遗传发现。这两种方法均已开源。 生成解剖和疾病特征的大规模量化以与生物库中的基因组数据相结合的过程。 正如机器学习帮助我们看到基因组数据的隐藏特征一样,它也可以帮助我们发现新信息并从其他健康数据类型中收集新见解。疾病诊断通常是关于识别模式、量化相关性或识别更大类别的新实例,这些都是机器学习擅长的任务。 谷歌研究人员已经使用机器学习解决了广泛的此类问题,但机器学习在医学成像中的应用更进一步:谷歌 2016 年介绍深度学习在糖尿病性视网膜病变筛查中应用的论文,被美国医学会杂志 (JAMA) 的编辑选为十年来最具影响力的 10 篇论文之一。 另一个雄心勃勃的医疗保健计划 Care Studio 使用最先进的 ML 和先进的 NLP 技术来分析结构化数据和医疗记录,在正确的时间向临床医生提供最相关的信息——最终帮助他们提供更积极、更准确的护理。 尽管机器学习可能对扩大临床环境的可及性和提高准确性很重要,但一个同样重要的新趋势正在出现:机器学习应用于帮助人们提高日常健康和福祉。人们日常设备逐渐拥有强大的传感器,帮助健康指标和信息民主化,人们可以就自己的健康做出更明智的决定。我们已经看到了智能手机摄像头已经能评估心率和呼吸频率以帮助用户,甚至无需额外硬件,以及支持非接触式睡眠感应的 Nest Hub 设备让用户更好地了解他们的夜间健康状况。 我们已经看到,一方面,我们在自己的 ASR 系统中可以显著提高无序语音的语音识别质量,另一方面,使用 ML 帮助重建有语言障碍的人的声音,使他们能够用自己的声音进行交流。支持机器学习的智能手机,将帮助人们更好地研究新出现的皮肤状况或帮助视力有限的人慢跑。这些机会提供了一个光明的未来,不容忽视。
用于非接触式睡眠感应的自定义 ML 模型有效地处理连续的 3D 雷达张量流(总结一系列距离、频率和时间的活动),以自动计算用户存在和清醒(清醒或睡着)的可能性的概率。 气候危机的机器学习应用 另一个最重要的领域是气候变化,这对人类来说是一个极其紧迫的威胁。我们需要共同努力,扭转有害排放的曲线,确保一个安全和繁荣的未来。关于不同选择对气候影响的信息,可以帮助我们以多种不同方式应对这一挑战。
借助环保路线,Google 地图将显示最快的路线和最省油的路线,用户可以选择最适合的路线。 Google 地图中的野火层可在紧急情况下为人们提供重要的最新信息。 趋势 5:对机器学习更深入和更广泛的理解 随着 ML 在技术产品和社会中更广泛地使用,我们必须继续开发新技术以确保公平公正地应用它,造福于所有人,而不只是其中一部分。 一个重点领域是基于在线产品中用户活动的推荐系统。由于这些推荐系统通常由多个不同的组件组成,因此了解它们的公平性通常需要深入了解各个组件以及各个组件组合在一起时的行为方式。 与推荐系统一样,上下文在机器翻译中很重要。由于大多数机器翻译系统都是孤立地翻译单个句子,没有额外的上下文,它们通常会加强与性别、年龄或其他领域相关的偏见。为了解决其中一些问题,谷歌在减少翻译系统中的性别偏见方面进行了长期的研究。 部署机器学习模型的另一个常见问题是分布偏移:如果用于训练模型的数据的统计分布与作为输入的模型的数据的统计分布不同,则模型的行为有时可能是不可预测的。 数据收集和数据集管理也是一个重要的领域,因为用于训练机器学习模型的数据可能是下游应用程序中偏见和公平问题的潜在来源。分析机器学习中的此类数据级联有助于识别机器学习项目生命周期中可能对结果产生重大影响的许多地方。这项关于数据级联的研究在针对机器学习开发人员和设计人员的修订版 PAIR Guidebook 中为数据收集和评估提供了证据支持的指南。 不同颜色的箭头表示各种类型的数据级联,每个级联通常起源于上游,在机器学习开发过程中复合,并在下游表现出来。 创建更具包容性和更少偏见的公共数据集是帮助改善每个人的机器学习领域的重要方法。 2016 年,谷歌发布了 Open Images 数据集,该数据集包含约 900 万张图像,标注了涵盖数千个对象类别的图像标签和 600 个类别的边界框注释。去年,谷歌在 Open Images Extended 集合中引入了更具包容性的人物注释 (MIAP) 数据集。该集合包含更完整的针对人类层次结构的边界框注释,并且每个注释都标有与公平相关的属性,包括感知的性别表示和感知的年龄范围。 此外,随着机器学习模型变得更有能力并在许多领域产生影响,保护机器学习中使用的私人信息仍然是研究的重点。沿着这些思路,我们最近的一些工作解决了大型模型中的隐私问题,既能从大型模型中提取训练数据,又指出如何在大型模型中包含隐私。除了联邦学习和分析方面的工作之外,谷歌还一直在使用其他有原则和实用的机器学习技术来强化工具箱。