编者按:AI的迅速发展成功催化了众多商业领域的数字化转型,在这一大环境下,微软也在不断探索着AI未来可能的发展方向。在计算机视觉、语音识别和自然语言处理等领域,我们已经取得了重大突破。同时,微软还始终坚持普惠AI的原则,希望更多的人能从AI 的发展中获益。我们相信AI应该放大而不是取代人类的聪明才智。本文中,微软(亚洲)互联网工程院常务副院长、人工智能核心及商用部总经理张祺博士在TEDx 演讲中为我们讲述了微软的人工智能之道。
数字化转型的浪潮给人工智能的发展奠定了坚实的基础。根据最近一期《哈佛商业评论》的统计,“84% 的受访 CEO 认为数字化转型已经迫在眉睫,近 50% 的 CEO 认为他们当前的商业模式在 2020 年将不复存在。” 而距离 2020 年还有不到两年半的时间。
AI 成为数字化转型的“催化剂”
什么是数字化转型?例如,搜索引擎就是图书馆的数字化转型。搜索引擎不仅改变了人们获取信息的方式和速度,还催生了像搜索广告这样每年千亿级的商业模式。在这样的环境中,AI 将成为数字化转型的催化剂,赋能企业和员工,优化流程,连接客户,实现企业和产品的转型升级。
麦肯锡全球研究院最近的报告中,对三类受访公司的利润率进行了比较分析。一类是积极采用 AI 的,另一类是有所保留采用 AI 的,第三类是尚未采用 AI 的。研究结果显示,积极采用 AI 的公司利润率明显高于行业平均水平,在某些特定的行业,如医疗健康、金融等,利润率甚至高出 15% - 20% 。这些数字告诉我们,AI 在商业领域的应用效能有多大。
微软坚信一点,AI 将有可能颠覆每一个商业,无论是纵向的行业领域,如银行、健康、零售、电信、制造;还是是横向的商业流程,如销售、市场、客服、人事、招聘等等。
具体如何颠覆?是完全取代,还是增强、赋能。这正是我们可以选择的方向。在微软,我们坚信,人工智能的第一设计原则是增强人类的能力,AI 应当放大人类的聪明才智,而不是去取代人类。
微软AI的最新发展
AI 并不是新技术,微软创始人比尔·盖茨,当今世界商业和科技领域最有远见卓识的领袖人物之一,早在 1991 年,就已提出 “创造能看、能听、能交谈,并且能够理解人类的计算机” ,自此微软开启了长达 26 年的人工智能基础研究,其中,计算机视觉、语音识别、自然语言处理是这么多年来的重要课题。
近年来,基于大数据、大计算、大算法(尤其是深度学习),AI 有了巨大进展。
在计算机视觉方面,2015 年微软发布的 RestNet (采用 152 层的深度残差网络),物体识别变得非常容易,正确率高达 96%,胜过了人类(在相同的数据集上,人类的识别错误率是 5.1%)。
在语音识别方面,微软首席语音科学家黄学东博士在今年 8 月份宣布,在 Switchboard 数据集上,微软语音识别错误率降低至5.1%。Switchboard 有很多背景噪音,被认为是业界最难的数据集之一。在这个数据集上,AI 已经达到了专业速录员的水平 ,超越了普通人类。
在自然语言处理方面,微软日前发布了 PowerPoint 同声翻译插件 Presentation Translator ,可以把演讲者的语音实时翻译成字幕,目前可以支持超过 60 多种语言。微软全球执行副总裁沈向洋博士在法国参加 Microsoft Experience 大会,所讲的中文,会自动翻译成法文字幕。观众还可以通过 Microsoft Translator APP 加入会议,在智能手机、平板设备或电脑上看到自己选定的语言字幕。
AI 不可怕,可怕的是强大的 AI 工具如果只掌握在少数几家公司手中。基于此,微软提出了普惠 AI 的概念:微软希望每一个工程师都能成为 AI 工程师,每一位数据科学家都能成为 AI 数据科学家,每一家公司都能成为 AI 公司。
为此,去年 9 月,微软成立了由微软全球执行副总裁沈向洋领导的微软人工智能及微软研究事业部(Microsoft AI and Research),全力推动人工智能及更多中长期技术战略和前瞻研究,目前该部门已经拥有超过 8000 名顶尖科学家和研究者。今年 2 月,微软还专门成立了一个部门——微软商用人工智能,致力于将人工智能技术以解决方案的方式提供给任何一家需要的企业。
我们发布了微软认知服务,Azure 机器学习平台,以及与 Facebook 联合开发的开放神经网络交换协议ONNX 。ONNX 能使在某一个深度学习平台上训练的模型,无缝地运行在另一个深度学习平台上。这对于深度学习神经网络的扩展,开发人员和企业之间的互惠互利,放大产品和技术势能,具有非常伟大的意义。目前,华为、英特尔、AMD、ARM 等公司都已加入 ONNX 。
说起人工智能,大家也许会觉得很遥远,其实人工智能离我们非常之近,例如日常生活中的智能客服。微软和惠普公司合作,通过用户行为分析与需求预测,帮助客服人员提高服务效率,从而把更多的精力投入到营销工作,从而把客服部门从成本中心转变为盈利中心。
人工智能可以帮助人类开展灾后重建工作。今年 9 月份,美国佛罗里达州飓风 “艾尔玛” 致使全州大部分地区停电。欧洲公司 eSmart 基于微软云和人工智能服务,开发了无人机输电线检查应用系统。利用深度学习分析实时分析无人机拍摄传送的视频数据,以便检查员快速发现电网受损情况,远离灾区危险地带,进行精准修复。
人工智能可以很有情怀。微软推出的Seeing AI APP,通过计算机视觉识别和语音合成技术,视觉障碍患者能重新“看到” 世界,拥抱生活和工作,可以像普通人那样在餐厅点菜,和同事在会议室无缝交流。
目前,人工智能已经取得了非常卓越的成就,但仍有很多问题尚待解决,比如,全球变暖、无损电力传输、精准医学等。这些都需要技术、产品、投资等领域的齐头并进。
量子计算是一种非常强大的技术,它将为人工智能提供强大无比的计算能力,再加上拉近用户和使用场景的混合现实,三者的聚合,将给人类带来无限的想象空间。微软相信,在这些技术逐渐完善、成熟的过程中,超级智能一定会出现,奇点(Singularity)的来临只是时间的问题。
在这种情况下,除了追求利润,实现商业上的成功,我们应该做什么?人工智能到底是敌是友,很大程度上取决于我们人类的选择。
AI 就好像是地球上 74 亿人类的孩子,刚刚学会看、听、说、读、写,正在学习如何分辨善恶。孩子从父母身上学到的东西对他行为上的影响要远远大于任何书本上的教条。人类的价值观,伦理观,将会对孩子的道德准则和行为规范产生非常深远的影响。大数据让我们人类的行为无处可逃,我们的一举一动,都会成为这个小孩(AI)学习的样本。
我们在担忧因人工智能的发展而失去工作的时候,有没有想过如何创造再就业的机会帮助和安置那些因无人驾驶、无人售货、智能客服的发展而节省的人力?
我们在担忧因人工智能的发展而沦为向机器行乞,要求 AI 具有同理心的时候,有没有想过向那些需要我们帮助的人伸出援助之手?
微软制定了一系列 AI 的核心设计原则,确保开发这项技术是透明的、安全的,为保护隐私制定了最高标准,同时包容、尊重所有人。我们相信道德和设计是相辅相成的:
第一,人工智能的设计目的必须是协助人类。
第二,人工智能必须是透明的。我们应该时刻注意人工智能的工作原理,以及它的规则是什么。
第三,在不破坏人类尊严的基础上,人工智能必须最大限度地提高工作效率。
第四,在设计人工智能技术时,必须要考虑智能隐私保护——必须要有先进的、值得信赖的保护措施,用各种方式确保个人和群体的隐私信息。
第五,人工智能必须要有算法问责机制,这样能让人类撤销意外伤害。
第六,人工智能必须要确保没有偏见,保证适当的和具有代表性的研究,这样就不会导致产生引起歧义的错误启发。
去年 9 月,微软联合亚马逊、谷歌、Facebook 和 IBM 成立了非盈利性质的人工智能合作组织(Partnership on AI),为人工智能的研究提供示范,包括伦理、公平、和包容性,透明性、隐私性和共同使用性,人和 AI 系统之间的合作,以及相关技术的可靠性与鲁棒性等课题;促进公众对人工智能的理解与科普,并定期分享人工智能领域的进展;为人工智能领域的研究人员提供讨论和参与的开放式平台,让研究者们之间的沟通更简单无阻。
人工智能通过大数据、大计算、大算法进行学习,如何教导 AI 待人处世,与人为善,是我们每一个人——尤其是 AI 从业者和缔造者——必须肩负起的责任。因为我们的价值观,我们的一举一动,都将影响 AI 未来的发展。我们在追求 AI 商业原力的同时,更应该以身作则,Lead AI by Example 。
张祺博士
微软(亚洲)互联网工程院常务副院长
人工智能核心及商用部总经理
微软亚太研发集团
张祺博士是微软(亚洲)互联网工程院常务副院长,微软人工智能核心及商用部总经理。张祺博士主要负责微软互联网及人工智能产品与服务变现和商业化的研发及战略决策工作,涵盖微软必应(Bing)搜索广告算法与平台、微软共享数据及平台、微软商用人工智能、微软对话人工智能商家技能平台等产品及服务。他负责的必应搜索广告和大数据团队在过去 6 年为微软带来了近百亿美元的营收,也为 Office 和 Office 365 产品的数据化和智能化奠定了坚实的数据基础和计算平台。
张祺博士是机器学习、大数据、计算广告领域的世界级专家,拥有十余项全球专利,多篇论文,他发明的半监督机器学习算法 EM-DD(NIPS 2001)曾被学术界广泛引用。
张祺博士于 1997 年本科毕业于北京大学,随后赴美国华盛顿大学深造,取得了纳米材料学博士和计算机科学硕士学位。
你也许还想看:
感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:msraai@microsoft.com。