更会“说人话”的三星Bixby,这回要把Siri按在地上摩擦?它们的区别又是什么?

2017 年 11 月 23 日 黑智 网易智能

三星 Bixby 登场,Siri是否感到了压力?

本文由网易智能(smartman163)授权转载

文 | 丁广胜


三星Bixby 登场,Siri是否感到了压力?


11月21日,三星人工智能平台Bixby中文(普通话)版正式在北京推出。中文版Bixby被命名为Bixby 真爱(AI),将于11月30日在国内正式上线,国行版三星Galaxy S8、S8+和Note 8将率先支持。作为AI领域的重要一环,微软、苹果、谷歌等巨头都已然在语音助手这块领地开始了布局,国内企业中,华为也相继入局。在今年年初,三星Galaxy S8发布会上Bixby首次在公众面前亮相,如今,中文版的Bixby 的发布,也让AI人机交互的战火,更为激烈。


三星Bixby主打的是“全面、真实”、会学习的AI,可以通过机器学习,适应用户,实现更新;可以学习用户的使用习惯;具有比其他语音助手更丰富的功能,可以根据语音指令自拍、照片分享、打开微信、发红包等功能。


三星表示,这是和Siri有着“根本性不同”的语音助手。三星电子中国研究院院长张代君说,这是一款“说人话”的语音助手。它突出了自己的学习能力和智能程度,相比起来,似乎一副要把Siri按在地上摩擦的架势。


那么,在三星看来,Bixby和Siri的区别,究竟在哪里?



“张教授对Bixby的研究到了痴迷的程度,我们现在都叫他Mr.Bixby。”


三星的同事这样评价张代君。他目前担任三星副总经理、三星电子中国研究院院长,张代君带领的团队立足中国,为中国本地化而生。


张代君已经投身无线终端技术研究和开发20年,主要负责三星电子中国研究院在视觉智能、语音语言交互、大数据挖掘、下一代无线通信, 以及本地智能服务等领域的技术战略、产品管理以及项目运营,三星电子智能交互产品Bixby中文版的研发与商用,就是他的团队一手打造。


张代君告诉网易智能,我们不再需要去学习如何与机器进行互动,而是让机器学习如何适应用户,对于本土化的Bixby产品,他谈到最多的四个关键词是:


“学习型AI、会说人话、认知容忍、软硬件结合。”


他认为在经历了键鼠交互、点触交互之后,Bixby代表了下一代交互方式,学习型AI让每个用户都作为老师,随着用户的不断使用,AI的智商情商得以不断提高。


对于人工智能行业,张代君坦言,智能硬件已经到达瓶颈,AI将会是未来行业竞争的关键因素,他还强调,“三星是一家AI技术公司”。


“我相信基于对手机的深度理解,以及对AI技术深度掌控,我们可以打造出与众不同的产品,我们更多的是关注用户痛点,而不是炫技。”张代君这样解释自己对于AI的理解。




以下由网易智能根据张代君问答实录整理:


智能设备到达瓶颈 AI将成竞争关键


问:三星Bixby涉及很多深层次的操作,比如推荐附近停车场、查看实时路况,以及更隐私的互动等等,怎样保证数据安全?


张代君:三星电子有丰富的AI技术,长期的技术储备,而且已经有AI产品陆陆续续的落地,同时我们有很强的掌控手机软件的能力,可以把AI技术的硬件和软件进行深度整合,这是我们在技术方面得天独厚的优势。


另一方面,我们整个基于AI的技术大量用到了云端设施,这些云端存储设施都在国内,和我们合作伙伴一起,并且这都是满足国内信息安全的规定,所以我想请大家不用担心这些事情,因为都是非常规范的商业运作。


问:在开发中文助手的过程当中,哪一块技术挑战最大?


张代君:其实Bixby不是一个助手,Bixby具备非常与众不同的业务能力。比如说,我们可以做到整个功能全覆盖,可以做到认知容忍,可以做到软硬件深度集成,用户可以进行个性化自定义等等。用户对Bixby反馈的时候都说:“终于会说人话的语音产品”,所以我们Bixby的概念就是你的最佳搭档。


中文版Bibxy由我们完全地自主开发,包括里面的云识别、自然语言理解的引擎,以及这里面的对话能力等等,在中文里面,其语言的复杂程度确确实实是千丝万缕,非常复杂。还好我们这里充分地考虑了自然语言的丰富多彩,以及人与人的差异化,所以我们特意打造了学习型的AI。


什么叫学习型AI呢?“三人行必有我师”,对于拥有交互式学习机制的Bixby来说,每个用户都是它的老师。随着用户的不断使用,配合后台深度学习机制,Bixby能够更加准确地理解用户意图,升级各项能力,智商不断提高。


基于用户画像和开放的用户自定义接口,随着时间的积累,Bixby会越来越了解你,成长为个性化同伴,所以,智能手机硬件的竞争正走向瓶径,而今后的行业竞争必将围绕AI。


打造会说“人话”的智能助手


问:具体谈谈三星智能助手和其他竞争对手的区别,比如Siri、Alexa、谷歌助理?


张代君:三星更加关注用户体验的提高,同时也有AI的前期产品陆陆续续的落地。我们对AI落地于手机有深度的思考,也就是说,今天手机对于用户有什么痛点?我们认为就应该用AI技术解决这些痛点。


首先,手机上APP越来越多,平均每个手机里都有一百多个APP,那每个APP里的功能也越来越多,而实际上大家找这些功能的时候非常烦琐。


其次,手机功能那么多,我们经常使用的都不到5%,这是真正的痛点。以前每出一个APP,每出一个智能硬件,人都要努力学习如何使用它们。我们思路是与其让人努力学习不如让机器主动适应人类,就是我们要打造统一的多模的交互产品,并借助自然语言理解。


自然语言方面,大家说话的时候可以按照教科书式的来说,但是自然语言本身很自然,在这种情况下有很多信息缺失,这需要用到认知容忍,就是你能不能准确理解用户的意图。我们特别开发了一个AI的学习接口,让用户去调教,同时可以去培养它的智商、情商,变成你个人的专属搭档,所以在打造学习型AI方面,我们把这个乐趣、能力开放给用户,所以Bixby是真正会说人话的语音产品,这不是我们自封的,这个产品跟其他的语音产品差异化非常明显。


问:Bixby和这些应用里的每个接口都是单独适配的吗?因为我看Bixby使用的时候背面有流程动画?


张代君:对于人机交互,我认为人机接口面临一个变革,Bixby可以做到用手可以触控,还可以基于Voice UI,实现语音控制和后续的自然语言理解,并且这种能力还在继续加强,尤其是随着用户学习型AI给我们的反馈,我相信我们会把和第三方合作高频的语句和场景进一步丰富和完善,相信会越来越好玩儿。


问:关于三星Bixby将来适配的机型方面,已知的是三星Note8和S8,将来还有哪些机型适配?如何定位Bixby?


张代君:如果从目前消费类电子方面来讲,三星其实早就有AI技术落地,比如生物识别技术认证,三星电子我们早期推出了指纹识别以外,我们率先在全球推出了虹膜识别,也推出了人脸识别,并且这些技术应用已经成为了当前旗舰产品应具备的标准配置。


另外,Bixby不仅仅有语音,当然可能主打的是语音,但是其实还有Bixby视觉,我们可以通过Bixby视觉察看这是什么东西,这个东西值多少钱,这是什么植物等等,可以为用户带来可以看可以识别功能产品。除此以外,其实三星Gallery用到了对图片的智能分类,这已经是在三四年以前就已经商用化落地了,用户感觉非常的方便。


我们要把Bixby打造成为一个开放的人工智能平台,Bixby是多模态的,我们这里用到了Bixby语音、Bixby视觉、Bixby主页、Bixby提醒等等,基于大数据打造成了多模态的产品。


“三星是一家人工智能技术公司”


问:三星研究AI技术的初衷是什么?三星对AI技术的未来有什么期待?


张代君:一直以来,我们坚持有意义的创新,积极参与到人工智能的研究中,去分析问题并寻求解决方法,将真正的智能交互方式展示给用户。


我们也在美国并购了Viv公司,我相信Viv公司将会集成到我们后续Bixby2.0的开发平台当中,再为我们对外合作、CP合作方面,我相信Viv将会起到非常重要的贡献,让整个Bixby平台更加插上腾飞的翅膀。


对于三星电子来讲,其实是一家AI公司,AI积累非常深厚,而5G方面三星在全球也是领先的,很快就会有冬奥会,大家可以看到三星电子在5G方面的优秀表现,对于人工智能,我们要做好本地的开发,同时也做好对全球的支援,在AI我们还有很多长远的战略,我们还有后续的一些产品的支撑,打造基于硬件软件完美的AI结合,这对我们来讲是核心竞争力。


我相信基于我们对手机的深度理解,基于我们对AI技术深度的掌控,我们在打造软硬结合方面,可以推出非常与众不同的产品,而且这不仅是语音产品,其实在不同场景下我们可能需要不同的人机交互,所以我们更多的是关注用户的痛点,我们不是炫技,三星的黑科技太多了,我们是看用户关注什么,用户有什么痛点,我们去解决用户痛点,我们去打造一个好的智能用户体验,一切是让用户体验好,我们做有意义的创新。


问:上下文理解和语音交叉这个问题上的处理大家都做的不好,您怎么看?


张代君:的确,这是语音产品的一大挑战,尤其对中文来讲是更大的挑战,所以三星特别在认知方面下了很大的功夫,所以学习型AI是未来的趋势,因为本身人类语言非常丰富,比如今天谈人工智能下围棋,明天谈360后空翻,人也要不断学习,人工智能也要不断学习,所以我们把AI接口开放给用户,通过几个层面不断令基于自然语言理解产品的能力不断获得提高。


问:对于语音交互,一般情况下我们觉得会比较炫酷,但是在公众场合,受到场景的限制,我们并不会首要考虑使用语音发送,您怎么看对这个问题?新产品有搭载声纹识别技术吗?


张代君:Bixby还支持使用键盘输入命令,对于特殊场景,语音命令使用不便的时候也可自如应对。


提到声纹,声纹识别领域发展非常迅速,在不同场景要采用不同的生物识别认证是比较可行的,就是刚才提到不同的场景,有的场景适合于语音,有的场景就适合触控,目前我们对于Bixby已经提供了这样的语音口令,关于声纹识别我们正在开发,不断优化性能,很快会上线。


关注网易智能(公众号 smartman163),获取人工智能行业分析与深度报告。



黑智专访


驭势科技 吴甘沙  搜狗 王小川

云知声 黄伟  格灵深瞳 赵勇

出门问问 李志飞 Roboteam Yossi Wolf

小鱼在家 宋晨枫  奇点机智 林德康

Rokid  Misa  瑞为智能 詹东晖

极限元智能科技 雷臻  乂学教育 栗浩洋 

 暴风科技 冯鑫 销售易 史彦泽

普强信息 何国涛 真机智能 刘智勇

纳人 姜海峰   众趣科技 高翔

拍拍赚科技 汤劲武  图森未来 陈默

智齿客服 徐懿  深之蓝 魏建仓

扩博智能 严治庆 视见医疗 王峰

  甘来 曹文斌  ROBOO 刘颖博

银河水滴 黄永祯 


投资人说


云启资本 黄榆镔  松禾远望资本 程浩

英诺天使基金 李竹   线性资本 王淮

九合创投 王啸    纪源资本 肖鸿达

戈壁创投 徐晨 百度风投 刘维




登录查看更多
0

相关内容

张代君,三星通信技术研究院院长。目前张院长投身无线通讯核心技术研究和开发领域19年的时间,成功领导和管理多轮新技术创新到产品商业化的转化,主要研究方向为5G移动通信、人工智能、IoT(Internet of Things)物联网等。这些都是时下最热门的方向,也最有可能诞生创新独角兽的产业。
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
人工智能少女的四年蛰伏
乌镇智库
3+阅读 · 2018年8月27日
专访沈向洋:入驻华为只是开始,做好AI是漫长的工程
微软丹棱街5号
3+阅读 · 2018年8月2日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
Arxiv
14+阅读 · 2020年1月27日
Self-Attention Graph Pooling
Arxiv
5+阅读 · 2019年4月17日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Attend More Times for Image Captioning
Arxiv
6+阅读 · 2018年12月8日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2017年12月29日
VIP会员
相关VIP内容
新时期我国信息技术产业的发展
专知会员服务
69+阅读 · 2020年1月18日
相关资讯
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
人工智能少女的四年蛰伏
乌镇智库
3+阅读 · 2018年8月27日
专访沈向洋:入驻华为只是开始,做好AI是漫长的工程
微软丹棱街5号
3+阅读 · 2018年8月2日
小冰,请接电话!
微软丹棱街5号
5+阅读 · 2018年4月18日
相关论文
Arxiv
14+阅读 · 2020年1月27日
Self-Attention Graph Pooling
Arxiv
5+阅读 · 2019年4月17日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Attend More Times for Image Captioning
Arxiv
6+阅读 · 2018年12月8日
Arxiv
7+阅读 · 2018年1月30日
Arxiv
5+阅读 · 2017年12月29日
Top
微信扫码咨询专知VIP会员