国内「语义」做得最好的创企突围记|专访三角兽创始人兼COO马宇驰

2018 年 11 月 12 日 机器人大讲堂

 

3个人,两年半,搞定四轮融资,组建了国内最大的人机交互团队,创立了国内人工智能语义领域发展最快,技术应用落地领域最广,拿融资最多的公司,这个公司就是三角兽。

 

三角兽创始人兼COO马宇驰在上个月接受了机器人大讲堂(RoboSpeak)的专访。马宇驰是连续创业者,拥有十多年市场经验,提到三角兽在商业上的愿景,他说目前是要做基于中文的最好的人机交互背后的语义引擎。事实上,三角兽已经做到了。


(三角兽科技创始人兼COO马宇驰)


三角兽做的是AI时代的「脑」


「语义」被业界誉为“人工智能皇冠上最后一颗明珠”,AI时代的“脑”。「人工智能只有语义领域的技术,能让机器拥有真正接近于人的思考方式和回应方式」马宇驰说。

 

相对目前热火朝天的图像识别、语音识别,语义作为AI领域更深层的基础技术,在国内起步较晚,人们也常常把「语义」和「语音」相混淆。


1、图像识别,相当于眼睛,比如格林深瞳、商汤科技、旷视科技、依图科技等公司;

2、语音识别与合成,相当于耳朵和嘴,比如科大讯飞、思必驰、云知声等公司;

3、语义识别,相当于脑,比如三角兽、助理来也、追一、竹间等公司。

 

当前,前两项技术(图像识别和语音识别与合成技术)瓶颈已经被打破,识别准确率可高达97%以上,已经超越人的识别能力。但语义识别尚未取得大的突破,今天的人工智能技术正处于一个从感知智能向认知智能方向全面发展和全面被需要的阶段。在解决了‘看见’和‘听见’问题之后,就需要解决‘看懂’和‘听懂’的问题了,也就是综合应用接收的数据来进行语义判断、语义解析和决策等过程。三角兽就是在做这种“智能inside”的事情。

 

是什么让三角兽做到了最好?


为什么三角兽在国内的「语义」领域做到了最好?马宇驰介绍,三角兽的强项主要在语义理解、开放域聊天、垂直领域任务型对话、以及跨域中控技术。随着苹果推出Siri语音助手、亚马逊推出内置Alexa语音助手的Echo智能音箱,语音智能已经开始走进千家万户,并成为行业发展的必然趋势。如今,国内最为知名的两款语音交互产品分别是微软小冰和百度度秘,而这两款开创了里程碑式先河的产品都是三角兽最初技术能力的背书!

 

三角兽三个创始人之一CTO亓超是微软小冰开放域聊天技术负责人,并且在百度度秘继续领导度秘的聊天能力。深耕NLP近二十年的亓超,相继被阿里、腾讯、微软、百度聘请,是少有的BAT+微软「通关」的工程师。另一位创始人CEO王卓然领导了度秘人机对话的跨域中控和多领域服务的接入,前东芝欧洲研究院对话系统组技术负责人,曾领导建立东芝第一代对话系统。三位创始人原来是老同学老同事关系。现在的三角兽由来自微软、百度、腾讯、阿里、IBM、乐视等企业的资深算法工程师团队和连续创业经验丰富的市场运营团队组成。所以,技术是三角兽的最强壁垒。


(左起:CEO王卓然,COO马宇驰,CTO亓超)

 

马宇驰感慨,三角兽的确也赶上了好时候,创业往往提前一步就成了烈士,提前半步才有可能做先行者。前几年在国内,NLP领域属于冷门,很少为人所知,也不被资本市场看好。2016年2月三角兽刚成立,3月AlphaGo便一夜成名,人工智能领域关注度突然被引爆,4月底5月初Google和Facebook开发者大会的主题都是NLP,在此之后国内资本、企业和政府迅速对“人工智能语义”领域显示出极大的兴趣。在三角兽天使轮融资前后,全球焦点都还停留在 AlphaGo对战李世石上,人机对话的概念一时间引来爆发式关注,并持续至今。2017年国家针对人工智能出台2030计划,自然语言领域和图像、无人车并列成为政府重点支持的八大技术,人工智能未来的发展前景开始明朗,并越发获得资本的青睐。

 

除了占尽「天时地利人和」,三角兽始终专注于自然语言理解和人机对话技术的研发与落地,三角兽重在“技术应用和技术突破”,而BAT等公司重在整个生态的构建,因此三角兽组建了国内最大的的人机交互团队,只专注于自然语言和人机交互,众多实际落地的合作案例是三角兽技术通用性很高的证明,也是技术壁垒的体现。

 

将彻底改变十几亿用户小习惯的「智慧识屏」


2016年,锤子手机惊艳科技圈的BigBang (大爆炸)功能,便是由刚成立几个月时的三角兽提供的底层核心算法技术。在此之后,三角兽又开发了针对手机的“智慧识屏”方案。 目前,三角兽已经占据了国内安卓手机「智慧识屏」的绝大部分市场,OPPO、vivo、魅族、中兴、锤子、诺基亚、夏普、海信、联想、黑莓、TCL、国美、360、努比亚等14家安卓手机品牌都应用了该解决方案。

 

「智慧识屏」解决了人们每天复制粘贴的麻烦。当我们在手机上遇到感兴趣的文字信息时,传统的搜索模式就是复制粘贴——选择或复制文本,退出APP,调取一个第三方APP,再进行粘贴或敲字并搜索,需要至少6、7步才能完成信息查询的操作。像这样的操作,我们每个人每天都要在手机上进行15次左右,甚至更多。

 

当用户在智能终端开启智慧识屏功能后,只需“一点”——长按手机中任何文本信息,即可触发这个功能,该功能将自动分析用户触碰文本的意图,并识别里面有价值的信息,判断出可以满足用户需求的相关信息,以卡片的形式弹出,用户直接点击卡片就能够一步完成操作。智慧识屏的价值实体已接入上百个不同领域的资源和服务,满足了用户在购物、快递、地图、餐厅、酒店、影视、音乐、动漫、明星等诸多方面的需求。



三角兽智慧识屏功能目前每天会收到近2000万次的用户使用请求。预计2018年底到2019年第一季度,该功能会覆盖1.5亿台左右的新智能手机,占新型号手机出货量的一半,2019年底覆盖的新老机型将突破5亿台,并且拥有相关专利。

 

三角兽的「对话交互平台」


在马宇驰看来,2015年9月中百度度秘出现之后,又能跟它聊天又能跟它要各种服务,国内才真正开始注意到NLP的落地应用,2016年下半年由于AI风口的出现,很多原来只是做问答、做句法分析、做知识图谱知识库、做模板聊天等等的公司也纷纷高举AI的旗号,将开放域聊天、任务驱动的多轮对话和问答系统混为一谈。

 

对话交互平台是三角兽主推的三项产品之一。预计2018年底,对话交互平台将接入2/3头部智能音箱,3/4的头部儿童产品,每天产生海量真实的用户交互数据,这也是三角兽不断加高的数据壁垒。据了解,目前三角兽拥有超过 500 亿组人与人之间的对话数据(未标记生语料),从这些语料中通过机器整理出 150 亿可用于机器学习的离线语料,三角兽的对话系统已经学习了接近 70 亿。公司也在数据处理上建立了一套高度自动化的数据处理系统,能很快处理新的语料和数据。数据是三角兽的核心资源之一,数据获取和学习也会是长期重点。

 

下图是三角兽关于夏普晓乐机器人的「多领域对话平台」,在真实的人机交互中,用户只需问询机器人“明天需要带伞吗”,就可以获取天气的详细情况,而不需要在问句中提到“天气”两个字,同时还可以满足用户查询播放音乐、查询歌手、设置提醒、控制电视等需求。



目前,三角兽对话交互平台接入的智能硬件设备包括手机语音助手、智能音箱、智能电视、智能手表、智能玩具、智能家居、智能车载等等,合作方包括百度的小度音箱、小米小爱同学、腾讯听听音箱、富士康晓乐机器人、长虹电视、读书郎、米兔故事机、火火兔、小天才手表等,同时与DuerOS、科大讯飞、云知声、猎户等平台合作,日均新设备数增长50万台。

 

不限定领域、不限定目的、不限定话题,让人与机器之间真正像两个朋友那样对话,被称为开放域聊天。开放域聊天的儿童聊天产品方面,为孩子保证了一个更加健康、安全的聊天环境,三角兽的儿童聊天的内容不良率低于了0.006%,远低于人类交流。

 

在专访中,马总现场向机器人大讲堂的记者展示了三角兽之前为小米电视提供的语音交互方案,并用语音来点播电影和电视剧。三角兽提供的模糊语义识别技术,可以根据用户不清晰或者不准确的表达,反馈尽可能准确的结果。比如可以将‘半月传’这个错误词,正确识别成《芈月传》,目前此功能将会输出给更多智能电视。

 

三角兽的「智能客服解决方案」


智能客服解决方案,是三角兽针对企业客服场景,提供语音导航、客服质检、智能问答、业务办理等自动化服务,实现7X24即时响应。三角兽的服务客户包括中国移动、广发证券、天弘基金、东方证券、恒生电子、新世界、新浪微博、光明网等具有强壁垒形式的客户。券商已经覆盖数千条知识问答。运营商方面,日均可以服务数百万移动客户;政府、党媒、央媒、智慧城市、智慧农业等都在逐步落地中。

 

前文提到的模糊语义识别在很多垂直领域都能适用,比如在与中国移动的解决方案中,用户可以向AI客服直接询问自己「上个月花了多少钱」,而不用刻板地询问「上个月账单」,可以询问「这个月还剩多少钱」,而不是告之「查询余额」。

 

机器客服将极大降低企业人力服务成本,智能客服对应的市场是千亿规模。

 

三角兽还在两会和十九大期间为光明网提供了技术支持,在安全性、反黄反暴的方面有极高的技术壁垒。“小明AI”分析了 40多万篇有关媒体报道和官方报告并对其进行训练,从 29 万个词汇中挖掘出近5000 个与两会相关的关键词,并据此整理出针对每一位代表委员的个性化报道。

 

三大挑战:融资、招人、市场


马宇驰在采访中坦言,融资、招人和市场是三角兽面临过的三大挑战。三位创始人专业不同,能力互补,三角兽所有重要决定都由三个人共同决策完成,其间遇到的所有分歧到最终也一定会达成共识。

 

创业至今的两年半时间里,马宇驰一对一地面见过600多位投资人、 1200多个合作伙伴,300多位媒体朋友,平均每天进行4-5个会面,每周要见的投资人、媒体、合作方都在20次左右。马宇驰说创业50%靠努力,50%靠运气,三角兽团队在努力的那50%做到了500%,团队从2016年开始几乎全年无休,后来才有了大小周的节奏,很多人在休息日仍坚持在岗位上。

 

马宇驰说:三角兽虽然是一家to B的公司,更像是B toB toC的公司,所有技术落地的产品,用户都能买到、体验到。C端用户的人机交互习惯正在逐渐成熟,从今年到明年会是高度成熟的状态。目前,三角兽几乎和所有巨头都在合作。

 

在人工智能语义分析领域,研发人才极其稀缺并昂贵。马宇驰和我们说,没招到优秀的人会比没融到钱让他更失落。三角兽认为目前人工智能语义领域还处于起步阶段,就好像是一场马拉松,跑50米和100米的区别。在资本高度关注的同时,语义这个高技术门槛的领域,还混杂了一些噱头公司,利用炫酷的demo鼓吹尚未达到的技术。一方面人们幻想过高,一方面不理解技术,将科技科幻化,导致大家认为行业进展缓慢不能落地。三角兽作为人工智能语义领域的头部公司,用近百个合作证明了语义技术的通用性和应用范围,在未来,技术和数据的不断提高,都将不断提高语义技术的边界。

 

北京卫视上周对三角兽的报道:



最后有个好消息!

三角兽正!在!招!聘!

机器人大讲堂开启了企业直招通道!让你的简历从千万个offer中脱颖而出,直达HR手中!

快点击文末的 阅读原文 了解三角兽详细的招聘信息吧!

 

  加入社群

机器人大讲堂Rob社群开始招募啦!如果您正在从事或想要从事机器人行业、想要学习这一方向,都欢迎您加入我们共同探讨机器人前沿科技。

 

在机器人大讲堂公众号对话框回复“交流群”获取入群方式!

 


登录查看更多
0

相关内容

面向司法案件的案情知识图谱自动构建
专知会员服务
126+阅读 · 2020年4月17日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
304+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
83+阅读 · 2019年12月13日
当 AI 全面实现认知智能时,机器人还只是机器吗?
未来产业促进会
5+阅读 · 2019年5月9日
招聘|国内语义理解最好企业「三角兽」招贤纳士
机器人大讲堂
3+阅读 · 2018年11月12日
已删除
将门创投
5+阅读 · 2018年10月16日
专访沈向洋:入驻华为只是开始,做好AI是漫长的工程
微软丹棱街5号
3+阅读 · 2018年8月2日
高额融资「狂欢」背后的旷视科技
机器之能
4+阅读 · 2017年11月1日
Multi-Grained Named Entity Recognition
Arxiv
6+阅读 · 2019年6月20日
Arxiv
5+阅读 · 2018年1月30日
Arxiv
4+阅读 · 2018年1月15日
Arxiv
4+阅读 · 2017年11月14日
VIP会员
相关VIP内容
面向司法案件的案情知识图谱自动构建
专知会员服务
126+阅读 · 2020年4月17日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
304+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
83+阅读 · 2019年12月13日
相关资讯
当 AI 全面实现认知智能时,机器人还只是机器吗?
未来产业促进会
5+阅读 · 2019年5月9日
招聘|国内语义理解最好企业「三角兽」招贤纳士
机器人大讲堂
3+阅读 · 2018年11月12日
已删除
将门创投
5+阅读 · 2018年10月16日
专访沈向洋:入驻华为只是开始,做好AI是漫长的工程
微软丹棱街5号
3+阅读 · 2018年8月2日
高额融资「狂欢」背后的旷视科技
机器之能
4+阅读 · 2017年11月1日
Top
微信扫码咨询专知VIP会员