Google 为代码世界所做出的「微小贡献」以及对改善真实世界的想法和结果,可能远远不止提到的这些。
11 月 28 日上午,2017 年 Google APAC Press 会议在东京主题为 Made With AI 的活动。
Google Brain 团队负责人、Google Research Group 资深院士 Jeff Dean 以及 Google AI 软硬件产品研发的负责人发表了演讲,Jeff Dean 向观众摆出了目前最为详细的 Google AI 产品阵列。
详解了 Google 是如何将 AI 和 ML(机器学习)技术运用到目前的软硬件产品上,以及如何用 AI 和 ML 技术赋予到社会公司企业,用行业 + AI 的方式解决更多棘手的问题。
Jeff Dean 头上顶了太多的光环。他是 Google Tensor Flow 项目的负责人,Google Brain 的联合创办人,Google 计算机学术研究方面的资深学者以及架构师等等,关于 Jeff Dean 有很多传奇故事和老梗,作为这个「编译器从来不给 Jeff Dean 编译警告,而是 Jeff Dean 警告编译器」的传奇人物,你只需要知道——Google 这家公司 AI 技术方面的问题,由他来发言是比较合适的就好了。
Jeff Dean 在东京的活动上,详解了 Google 旗下那些使用了 AI 技术的软硬件产品,并对 AI 技术的未来提出畅想。
那些潜移默化影响你的 Google AI 产品
Jeff Dean 提到今天的主题可以分为三个大的部分,主要是:利用 AI 技术使 Google 自己的产品更加实用;利用 AI 技术帮助企业和开发者进行创新;利用 AI 技术让世界变得更美好,既觉人类面临的问题。
为了让人们更了解机器学习,Jeff Dean 现场又讲了机器如何识别猫的故事。
Google 在 2012 年发表了关于机器学习猫的论坛以及在 2015 年开源了 Tensor Flow 框架,Google 通过大量的猫图片告诉系统这是「猫」,而提供机器学习自我的判断能力,当机器学习能够准确的识别一张新的图片是「猫」时,说明它已经具备一定的准确性了。
这种机器学习的技术将会大量的运用在语音识别、计算机视觉、识别 Email 中的垃圾邮件甚至时下最热的无人驾驶技术当中。
计算力和大数据的突破,成就了今天的机器学习和 AI 技术,Jeff Dean 认为如今的 AI 技术的迅速发展是难以想象的。机器学习仍处于发展初期。但如今,机器学习对分类,预测,理解和生成这四个关键方面很有帮助。
来看看 Google 旗下的那些采用了 AI 和 ML 技术的标杆级产品。
比如关于机器学习的分类,Google 有 Google Photos 中的照片搜索(Photo Search),Google Translate 中的即时相机翻译(Word Lens)和 Google Lens;
关于机器学习的预测:Gmail 和 Inbox 中的智能回复(Smart Reply)和 Google Maps 中停车难易度的图标(Parking difficulty icons);
关于机器学习的理解:Google Assistant,YouTube 中的自动字幕(Auto captions)和 神经网络机器翻译(Neural Machine Translation)。
Google 翻译如今同时结合了计算机视觉和神经网络,可以通过语音输入,也可以直接拍照翻译。Google 介绍,目前已经实现了 97 种语言的机器自动翻译,准确性提升也超过了过去 10 年。
这也是唯一一个不需要科学上网就能在中国使用的软件。
而其他使用了 AI 技术的软件也潜移默化的对你的高效使用产生了影响。比如在 Goolge Photos,用户可以更方便的找到自己想要的特定图片,比如直接搜索「狗」,计算机视觉已经自动识别出很多的「狗」并归类,Google Photos 还拥有向用户推荐和生成图集的功能。
Google Lens 则是在今年 5 月份推出的一款基于图像识别的产品,简单的来说,就是让机器理解你给出图片,让机器学会「看图说话」。这项基础技术的意义是在 Google AI 产品阵营中随机组合,比如进入到 Google Assistant 助手当中。
利用在 Gmail 的 AI 技术则是帮忙机器智能学习邮件回复,在使用手机回复邮件的过程中预判你可能需要回复的邮件内容。
比如当有人发邮件询问你——「下午一起去星巴克喝个咖啡时?」,邮件可能会直接给出「好啊,我有时间,到时候见」以及「时间不允许,我今天有点忙」之类的回复选项。这用于提高手机回复邮件的速度。
另外,Google Maps 可以预测你的目的地有没有停车位,标出停车难易度;Google Play Music 中用 AI 预测你的音乐洗好并进行推荐;Google Allo 可以让使用者在回复表情时,对自己的形象进行涂鸦,以此来表示心情;在 YouTube 上,机器学习已经给 10 亿的视频自动加上了字幕,可以让世界上近 3 亿的聋哑人或者有听觉障碍的人可以看到视频上的东西;而 Google Assistant 则是由很多机器学习的基础能力构成一个主打语音交互的智能助手。
软件之后,Google 的产品经理 Isaac Reynolds,介绍了 Pixel XL 相机的人像模式(Portrait Mode),一个用 AI 技术打造的拍照功能。
在 Pixel 2 XL 手机中,Google 使用算法解决了拍照中背景虚化的问题。在一众用双摄像头提高拍照素质的手机中,Pixel 2 XL 在 DxOMARK 上也取得了不俗的成绩。简单来说,就是能用算法解决的,就不要盲目堆彻硬件!
Google 又介绍,将 AI 技术与软硬件结合的更好的一个例子 Pixel Buds。
戴上它,它可以实时帮你将周维的人说得话翻译成你的母语,同时集合了语音技术和翻译技术。
情怀项目落地——Noto Fonts 和 Project Unison
再次谈到了一些产品系统级的 AI 应用,会又让人觉得 Google 总是在低调的做一些看似微小的事情。
我在参加之前的北京 Google 的一次活动中,Google 就详细接受了 Unicode。例如 Google 内部在讨论并敲定新的 Emoji 表情之后会向 Unicode 协会提交申请,Unicode 协会再同各个合作公司讨论。
当最终讨论通过后,Unicode 协会便将新的 Emoji 表情加入全球 Unicode 列表里,然后每个公司会开始设计相应的、自己风格的 Emoji 表情,经过 Unicode 是以此来保证 Emoji 表情再跨平台的收发时不会出现「豆腐」(乱码)的情况。
而在语言方面的 Unicode,则让更多语言进行统一编码,Noto Fonts 就是消除「豆腐块」的意思。从更高维度的字体库层面,消除乱码,让输入变得更加个性化和易用。
Noto 字体,Google 定位其为一个「包含全球语言的字体工程」,只要是电脑上有编码的语言就要做字体,并且期望 Noto 可以在不同尺寸的屏幕上均能提供高质量、易阅读的体验。
Google 这次还介绍了一个情怀项目 Project Unison,这个项目为一些小语种的用户打造 TTS(语音合成),比如在中国解决机器用粤语和用户对话的问题。
简单来说,让每个小语种的用户每人对机器说 45 分钟话,他们一共统计了 2000 多种语言。而产出的 TTS 机器语言,既不会太像人,但也不全是机器口音,会取中间…….
围绕这样的方言,就可能产生比如新加坡英语口语,中式英语,当然主体是保护小语种使用者,比如孟加拉语,高棉语和爪哇语。让他们有更多的语料库,可以说这才是真正的情怀了。
Google 研究项目总监 Linne Ha 提到——世界上有 6000 种语言,另外还有很多方言,这其中超过 100 万人以上使用的语言有 400 种,但是,目前网络上的内容大约 50% 以上都是英文,这就是用机器学习来解决语言互通的重要性。
「语言是身份不可或缺的一部分,谷歌想要创造一个技术,能够让更多的人联网,让不同语言的人上网更容易。」
关于 Tensor Flow 和 Google Assistant 的情怀
Google Assistant 工程总监 Pravir Gupta 介绍了 Google Assistant 的现状——目前的 Google Assistant 支持不同种类的任务,比如寻找某一问题的答案、导航服务、获取新闻或得到日程安排方面的帮助。
他以日本市场为背景,问了「在东京是不是要给小费」、Google Assistant 准确回复了他想知道的问题;例如他的孩子还喜欢听各种动物的叫声,可以问「八哥是怎么叫的」等问题。
关于 TensorFlow,Google 提到最新使用情况来说,现在有 1 万的全球开发者在使用。
使用 Tensor Flow 解决企业的问题,就是行业 + AI 的典型案例。比如日本当地的一家叫丘比的公司在 TensorFlow 的帮助下正在提高食品材料的质量和安全性。
丘比使用 TensorFlow 开发出一个工具,可以从婴儿食品中所使用的切块土豆中检测出食品生产中有缺陷的成分。
来自丘比的 Takeshi Ogino 介绍道:「人工智能以近乎完美的精准度,挑选出有缺陷的食材,这对我们的员工来说非常鼓舞人心。」
机器学习也可以帮助人类解决面临的一些重大挑战:如医疗保健、能源和环境保护问题。
Google 产品经理、医疗成像团队负责人 Lily Peng 的团队与印度、泰国和美国的一些医院合作开发一种工具,可以通过机器学习帮助诊断糖尿病所引起的眼部疾病。
机器学习模型同样可以追踪当前濒临灭绝的珍惜物种,很多动物肉眼难以监测,所以 Google 团队与澳洲生物学家一起建立了一个 TensorFlow 模型,让机器自动追踪动物,更好保护濒临灭绝的动物。
同时,机器学习也用于图像识别乳腺癌。乳腺癌当当前误诊率很高的疾病。而机器学习的技术,就可以更精准,在这方面,利用 AI 测试的得分已经超过了人类医生的得分。
而另外一家使用了 Google 机器学习的研究机构介绍,他们正使用人工智能保护鸟类。他们致力于追踪新西兰濒临灭绝的鸟类,以改善对它们的保护工作。
他们首先收集了 5 万个小时的音频并将其转换成谱图,通过 TensorFlow 更加快速高效地分析这些音频,识别谱图中的鸟鸣声。
AI 民主化和包容性
AI 民主化是让更多的人使用到 AI 技术,以及让更多的人使用 AI 技术来解决社会疑难问题。
另一课题是,如何将机器学习也自动化呢?
Jeff Dean 再次登台,他希望让每个人都用上机器学习。他提到,他们培训 Google 工程师如何使用,告诉他们什么样的方法是最佳的。他介绍到,Google 中已经有 18000 员工参加了培训,他们还将和外部的大学进行试点,参与到学校机器学习的课程中。
Jeff Dean 提到了 Google 提出的愿景——作为一家 AI First 的公司,Google 致力于让每个人都能够从人工智能中获益。
但目前来看,Google 已经取得了一些进展,但是仍然有一些困难需要克服。为了想方设法让机器学习模型的创作过程更加触手可及:
Google 提到了几个月之前提出的 AutoML 项目,这用来研究如何使用 AutoML 自动创建机器学习模型。Google 希望构建更大的机器学习社区来帮忙建立更多的模型来解决他们未曾想到的那些问题。
其次,为了确保 Google 构建的机器学习模型具有包容性,并且能够真正为每个人所用。Google 提出了 PAIR 计划——「我们启动了 People + AI Research (PAIR) 计划,这个计划旨在将 Google 的研究人员聚集在一起,研究并重新设计人与人工智能系统交互的方式。
Facets 作为这个计划所孕育出的一个开放源码的机器学习工具,能够用于机器学习的训练数据可视化。」
除此之外,Google 还与 Geena Davis 研究所合作建立了 GD-IQ,一种利用机器学习检测电影中性别偏见的工具。
总之,Google 为代码世界所做出的「微小贡献」以及对改善真实世界的想法和结果,可能远远不止提到的这些。
HAY! 17 年度科技大趴华丽重启!
门票可继续有效使用,
大咖嘉宾、数码粉丝辩论赛、AI 翻译大赛…
12月16日北京不见不散!
👇👇👇少量余票狠戳小程序👇👇👇