最近,我作为一个嘉宾,参加了斯坦福大学举办的主题为“人工智能可达性”的沙龙,这其中就有斯坦福大学人工智能实验室成员之间的自由讨论。在这次沙龙中,有许多有趣的问题和主题,因此,我在本文中分享一些我的见解。
答:
使用人工智能,可比相信那些天花乱坠的宣传,要简单多了。我最近在麻省理工学院技术评论会上的演讲 [1] 中,揭穿了几个常见的误解 [2],即你必须有博士学位、巨大的数据集或者昂贵的计算力才能使用人工智能。
大多数人工智能研究人员并没有致力于让计算机实现人类意识。 人工智能是一个非常广泛的领域,并且对于该领域中包含的许多东西(尽管这是每个人都在使用的术语,但我还是会遵循)来说,这个称谓有点误导性。上周我与 NPR 记者交谈了 20 分钟,然后我才意识到他认为我们谈论的是实现人类意识的计算机系统,而我却认为我们谈论的是 Facebook 用来决定向你展示哪些广告的算法。像这样的事情经常发生。
在 95% 的时间里,当人工智能的从业者讨论人工智能时,他们指的是执行特定任务的算法(如照片排序、语言翻译或者 Atari 游戏获胜);而在 95% 的时间里,不了解人工智能的人们一听到关于人工智能的东西时,他们认为人工智能就是一种实现了超智能的人形机器人。我相信,这一状况会导致很多不必要的困惑和恐惧。
有几个问题,比邪恶的超智能威胁要紧迫得多 [3],比如,我们如何将种族和性别偏见 [4] 编码为算法(这算法越来越多地应用于招聘、解聘、医疗福利、刑事司法以及其他影响生活的决定)或加剧不平等(以及算法在延续和加速这一过程中所起的作用)。
另外,去年我发表了一篇博客文章,提供了关于人工智能的可信来源 [5],这些信息都是面向普通读者的,对于希望了解更多信息的人们来说,可能是一个方便的资源。
答: 这是我对人工智能研究人员的愿望清单:
为你的论文写一篇博文(关于阅读学术论文,我们给 fast.ai 学生的一些建议是,首先要搜索是否有人写过博客文章)。
分享你的代码。
尝试在单个 GPU 上运行代码 (这是大多数人都可以做到的)。Jeremy 和我有时会遇到显然从未在单个 GPU 上运行过的代码。
在论文中使用具体的例子。最近我正在阅读关于公平性的论文,这些论文堆满了数学方程式,甚至像我这样拥有数学博士学位的人,也很难将其映射到现实世界中去。
答: 是的,深度学习模式对训练是出了名的挑剔。我们有很多成功的学生项目 [6] 都是从 fast.ai 出来的,我相信其中的一些因素是:
fast.ai 课程 [7] 是围绕一系列实用的实践案例研究(涵盖了计算机视觉、自然语言处理、推荐系统和时间序列问题)而设计的,我认为这给学生的许多项目提供了一个很好的起点。
我们开发了 fastai 库 [8],它的主要目标是让学生容易使用并应用于新的问题。这包括像学习率探测器、设置良好的默认值和编码最佳实践 (如周期性学习率) 等创新。
fast.ai 并非一家教育公司;我们是一家研究实验室,我们的研究主要集中在如何使深度学习更易于使用(与深度学习更容易学习的目标紧密结合)。
所有这一些都表明,我确实希望你能明白这一点:深度学习的模式仍然令人沮丧,对训练非常挑剔!我认为在这个领域工作的每个人,都会经常遇到这些挫折(我期待随着这一领域的成熟和进步,这种情况有所改善)。
答: 通过可达性,我指的是来自各种背景的人:教育、居住地 [9]、专业领域、种族、性别、年龄以及更多的人都应该能够将人工智能应用到他们所关心的问题上。
我认为这很重要,主要有两个原因:
从积极的方面来说,来自不同背景的人会知道并关心其他人所不知道的问题。例如,今年秋天我们有一个学生,他是一个加拿大奶农,用深度学习来改善山羊的健康状况。这是一个我从未想过的应用。
来自不同背景的人有必要尝试发现人工智能的偏见和负面影响。我认为,来自那些没有足够背景的人最有可能会发现人工智能可能是有害的 [10],所以他们的加入是至关重要的。
我还想让来自不同背景的人们对人工智能有足够的了解,以便能够确定人们何时销售蛇油 [11](或者只是对他们能够合理提供的东西过于乐观)。
目前,对于我们的编程实践深度学习课程,你需要一年的编码经验才能学到深度学习,尽管我们正在努力降低进入门槛。我还没有查看最新版本的 deep learning SAAS API(它在我的待办事项列表中),据说它允许人们在不知道如何编码的情况下使用深度学习,但我最后一次检查时,这些 API 有几个缺点:
不是真正最先进的结果 (为此,你需要编写自己的代码),这是大多数人想要的。或者只在相当有限的问题上工作。
为了有效地使用 API,你需要了解编写自己的代码所需的内容 (在这种情况下,人们更喜欢编写自己的代码,因为这给了他们更多的控制权和定制权)。
虽然我支持任何人都可以使用的机器学习 API 的长期愿景,但我怀疑这项技术是否真的能够提供性能足够强大到足以消除代码的技术。
答: 虽然我同意让深度学习像汽车一样容易使用是长期目标的这一观点,但我认为,我们离这一目标还有很长的路要走,与此同时,谁参与其中也很重要。让一个同质化的群体去开发技术,势必会影响到我们所有人,这样是很危险的。
例如,直到 2011 年,汽车制造商才被要求除了“标准”男性测试假人,还必须使用具有典型女性解剖结构的碰撞试验假人(我从 Timnit Gebru 等人的论文《Datasheets for Datasets》[12] 了解到了一个事实,其中就包括有关电子、汽车和制药行业如何实现标准化的精彩案例研究)。正如这篇论文所述,“1998~2008 年间生产的汽车安全研究得出的结论是,在类似事故中,使用安全带的女性比男性严重受伤的可能性要高 47%”。
进一步扩展到汽车的类比,有很多事情对汽车系统以及就它们发展的方式来说,并没有达到最佳标准:美国在公共交通方面的投资不足,自由停车如何导致城市扩张和拥堵,以及化石燃料对电力的负面影响。如果这些发展中的汽车来自更广泛的背景和领域,这些情况会有所不同吗?
最后,回到人工智能的可用性和可达性的问题,这两个问题都很重要:
谁帮助创建抽象和可用性接口?
谁能够在此期间使用人工智能?
答: 在 fast.ai,我们强烈建议人们根据需要 [13](以及这篇文章和视频:To become a data scientist, focus on coding[14]、How to Learn Deep Learning (when you’re not a computer science PhD)[15])来学习数学。感觉就像你需要学习所有你需要的数学知识,然后才能开始研究你感兴趣的话题,这是一种令人沮丧的方法,而大多数人都很难保持动力。如果你的目标是将深度学习应用于实际问题,那么大多数的数学知识都是不必要的。
通过面对面上课的课程更好,这是我的想法。尽管我们将所有的课程资料放到网上免费提供,但我们还是有几个学生从其他国家(包括澳大利亚、阿根廷、英国和印度)前往参加我们的面对面课程。如果你选择在线或者远程学习课程,我绝对建议你尝试在你所在地区组织一个面对面的学习小组。无论如何,到 fast.ai 社区转转吧,你一定有所收获!
(fast.ai 社区:http://forums.fast.ai)
我有数学博士学位,所以我在研究生院学了很多数学。遗憾的是,我忘记了很多我没有使用过的东西 (我的大部分研究生课程都是十年前完成的)。考虑到我现在所做的事情,这并没有很好地利用时间。所以,我不知道选择一门你可能不需要的课程究竟有多大用途(除非你纯粹是为了享受,或者你打算留在学术界)。
最后,在与学生交谈时,我认为人们对数学的焦虑和消极情绪是一个比他们不理解概念更大的问题。在美国,数学是如何被教授的,文化是如何被传授的,很多人都有不同的想法,所以很多人都有这种感觉是可以理解的。
[1] Accessible AI: Expanding the Reach of Intelligent Solutions
https://www.technologyreview.com/video/610690/accessible-ai-expanding-the-reach-of-intelligent-solutions/
[2] The startup diversifying the AI workforce beyond just “techies”
https://www.technologyreview.com/s/610633/the-startup-diversifying-the-ai-workforce-beyond-just-techies/
[3] Thoughts on OpenAI, reinforcement learning, and killer robots
http://www.fast.ai/2017/07/28/killer-robots/
[4] Diversity Crisis in AI, 2017 edition
http://www.fast.ai/2017/08/16/diversity-crisis/
[5] Credible sources of accurate information about AI
http://www.fast.ai/2017/09/19/accurate-info/
[6] How the Jupyter Notebook helped fast.ai teach deep learning to 50,000 students
https://www.youtube.com/watch?v=frc7FgheUj4&index=2&list=PLtmWHNX-gukLQlMvtRJ19s7-8MrnRV6h6
[7] fast.ai Course
http://course.fast.ai/
[8] fast.ai library
https://github.com/fastai/fastai/
[9] Deep Learning: Not Just for Silicon Valley
http://www.fast.ai/2017/02/27/not-just-silicon-valley/
[10] When Data Science Destabilizes Democracy and Facilitates Genocide
http://www.fast.ai/2017/11/02/ethics/
[11] Machine learning hasn't been commoditized yet, but that doesn't mean you need a PhD
http://www.fast.ai/2017/03/17/not-commoditized-no-phd/
[12] Datasheets for Datasets
https://arxiv.org/pdf/1803.09010.pdf
[13] So you are interested in deep learning
http://www.fast.ai/2016/12/19/favorite-posts/
[14] To become a data scientist, focus on coding
http://www.fast.ai/2017/03/23/focus-on-coding/
[15] How to Learn Deep Learning (when you’re not a computer science PhD)
https://vimeo.com/214233053