扩博智能CTO柯严:如何用计算机视觉数字化改变世界?

2019 年 2 月 27 日 黑智

点击上方黑智选择“置顶公众号”

黑智专注AI落地,探讨AI商业价值


更多创业内容请访问http://www.iheima.com/scope/79



文 | 李夜


计算机视觉如何数字化改变世界?


或许,可以从扩博智能的落地案例中找到答案。它横跨风机叶片巡检和零售快消两个领域,为它们提供特种飞行机器人全自动风机叶片巡检和实体零售数字化管理解决方案。即便风电行业和零售业在外界看来,毫不相干。


扩博智能成立于2016年11月,由四位微软前高管发起成立(文末附四人简历)。博士多,是该公司的一大特点,研发团队有25%的博士及以上学历。扩博智能创始人兼CEO严治庆说,“在计算机视觉、机器学习、云计算和智能硬件领域,他们有十几年的经验,打好这个组合拳是扩博智能的核心技术优势。”


这群博士如何在两个看似毫不相干场景中大开脑洞,带着这个疑问,i黑马&黑智采访了扩博智能CTO柯严。


在回答这个问题之前,黑智先介绍一下柯严这位扩博智能技术灵魂人物的工作履历。和严治庆一样,他曾在微软工作,是Bing search(必应搜索)美国总部的研发团队负责人。



(柯严)


柯严2008年CMU卡耐基梅隆博士毕业后,进入西雅图的微软公司Bing必应团队工作,他从Web Index Selection项目开始成名,在当时就使用了Machine Learning的方法做Page Ranking,完全没有使用人工标注数据。


随后柯严提出了IE的Flip Ahead功能,通过机器学习的方法判断客户最有可能下一步点那个页面,在机器端进行提前加载,提升用户体验。柯严从2013年开始带团队做高难度知识图谱项目工作,Knowledge Graph有3亿个真实的用户使用场景对象,利用一万亿个互联网上的网页,服务于5亿用户。即便跑一个普通的任务,也需要使用高达数十万台的微软云端的高端虚拟服务器,该项目从开展到交付使用,仅用时四年,比同期谷歌项目缩短了一半时间。“我们没有利用外部资源或者收购第三方技术,完全是内部自有资源从头开始完成的。”


后来,他一直在思考如何能够把计算机视觉和机器学习更广泛地分享给更多企业。这可以为被看作柯严2016年出来创业的动机。再加上当时,一些硬件制造商可以生产带有高分辨率摄像头的智能硬件,比如无人机;一些软件公司在做数据分析平台,但都是割裂的,并不成体系。“我们当时决定做点和计算机视觉、智能硬件相关的事情,因为行业中一定会生成大量的数据。我们开始利用自身在企业服务和计算机视觉方面积累的能力,尝试帮助企业,把物理世界进行数字化。”


一开始,柯严他们构建了一个无人机平台,“数以千万计的无人机可以跟我们的数据中心相连接,我们的机器学习和计算机视觉的算法可以帮助我们去分析这些无人机采集的数据。”但他们很快发现由于无人机需要飞手,操作上对于普通人群有困难,企业购置的无人机多被闲置在角落,很难普及。


这让扩博智能意识到行业需要一个端对端的解决措施。“方法只有一个:软硬结合。我们把机器学习的算法应用在其中,来帮助这些企业去把所有的视觉化过程都完成,找到一个自动化的端对端的解决措施。”


柯严如是描述该方案,“例如在风电行业,企业一线工作人员只要按一个按钮,特种飞行机器人就会起飞。通过固态雷达+机器视觉+传感器,能够全自动飞行,跟踪叶片,然后拍照。拍完了,数据会传到云上,有深度学习可以自动识别,生成数据。你可以想象它是一个硬件+软件+算法的视觉的一个集成。


这台机器人就像是自动驾驶汽车一样,有固态雷达、摄像头、传感器,机器视觉算法等飞行控制算法等,通过中控来全自动的对飞机姿态,拍摄效果,飞行路线做定义,不需要人工进行干预。我们的算法会不断地进行优化,让整个飞行拍摄过程越来越有效率。因为是全自动的三维自动驾驶,所以不需要对风机,风场,品牌进行任何定制化的设置。”


这个方案最先被用到风电领域,风电行业是一个听起来陌生但体量却不小的领域。据悉,每年全球风电行业有 250 亿美金投入风电机运维当中。其中,中国约占市场的三分之一,还是全球增速最快的市场。在中国,有 10多万台风电机组,而且每年还在扩建,目前主要建设都是挑战更大的海上风机。


风电机运维痛点也不小。工程师需要爬到风机顶端,用绳索、梯子、昂贵设备做检查。一般情况下, 4 个人要花半天时间才能完成一次风机检查。每年,类似的检查需要两次。如果是在海上,运维的难度就不是一个指数级别的了,很多地方海上巡检和维修就是看天吃饭。


用机器人巡检叶片有几个优势: 一,更简便,比传统的巡检设备更快,巡检效率比过去高 10 倍;二,数据报告、生产速度提升了 8 倍,接近 10 倍; 三,在 30 分钟以内完成巡检,一个人监测就可以了,一个技术人员可以同时进行多个巡检;四,在清晰度、精度这方面,可以实现 1-3 毫米的高精度图片采集。


未来,扩博智能从风机叶片巡检切入以后,还会做预测和全生命周期的资产管理。“如果数据足够多的话,我们就可以知道在哪里搭建风车比较好,因为温度、天气(雨、雪、风沙)对风车影响很大,这会导致运营成本差别很大。如果我们能够拿到数据,就可以告诉风车厂应该在哪里造风车,在哪里造风车的维修成本是最低的。”


涉足零售行业是因为客户的一次需求,这个客户是“一个比较有名的饮料公司”。公开资料显示是可口可乐。“他们在上海每天派上千个人到店里查看货架、冰柜等,看重点的SKU瓶子摆得对不对,每个瓶子的数量够不够多、位置摆得对不对、有没有缺货。”和风电巡检一样,这也是一个耗时费力,数据难以可视化的枯燥、重复工作。


当这个问题摆到扩博智能的桌面上,柯严想到的是用计算机视觉来做。但是这需要解决一个如何识别海量SKU的问题。比如说像沃尔玛、家乐福这种大型超市,有10万种SKU,如果每个SKU都要训练模型的话,这个是完全不行的,因为人工标注的成本太高了。


扩博智能采取的方式是半自动化,“我们的工作是教会机器去联想 (More generalization), 通过相似度的方式去联想 (Similarity), 机器不需要知道A是什么东西,叫什么,但是机器知道A和B两个是同一样东西。我们使用少量的渲染过的照片,就可以开始学习识别了。而且可以在海量数据里找新产品,不认识的产品,数据量越大的时候,价值越大,找相似的产品越准确。”


在柯严看来,人工智能最终实现的是人和机器的结合,纯人工做太苦、太累,纯机器做又不太准确,而且需要大量的数据标注,最好就是人和机器的交融。任何学习也都是如此,双向互动最合适,要学会跟机器交流。“传统的机器学习,就是把大量的数据喂给机器,人是不知道机器要什么,机器也不知道它需要什么,这种方式最终也是可以做成的,但是成本是非常非常高的。”


和风电一样,在零售领域,扩博智能也是和大公司一起打造行业解决方案。这样做的好处在于头部企业的多样化需求和具有参考价值的行业标准,“今后,我们服务同类其它型公司会轻松很多。”据了解,打造实体零售数字化管理解决方案用了一年的时间。从最开始的小规模的POC测试,慢慢上量、上规模,2018年夏正式交付。


回到本文开始提到的问题,如何横跨两大看似毫不相干领域,并落地产品?


柯严提到,风电和零售行业落地的解决方案,共用的不是具体技术,而是技术储备。技术储备指的是,人才和经验。“机器学习Machine Learning自身的工具是相通的(Tooling), 对于人才来说,深度探讨理论知识很重要,除了算法数学好,还需要了解机器边界和限制,这就需要我们的人才除了有深度还有广度,也就是经验丰富。”


问及扩博智能在零售领域的积累,柯严认为两个方面:一,算法本身识别的模型。二,数据。“这个是最重要的,其他公司是没有的。我们花了很多时间,除了积累数据外,还开放很多工具和算法,数据积累速度变快,我们积累的数据比别人多,还比别人快。”


从某种角度来看,品牌公司跨界需要平衡,“做一个具体解决方案,如果你有很针对性地做,那你就做得深,但风险是很难扩展到其他领域。如果你一开始就做一个平台,希望平台是通用的,但最后可能发现平台不解决任何问题,平台对某一个领域能够解决80%的问题,但客户要求的是100%,剩下的20%怎么办?这需要平衡。”


2019年,扩博智能将全面开拓国际化市场提上日程。“现在,扩博智能已经开始做海外市场了,我们选的品牌商都是国际化的,他们的市场不只是在中国,也是全球分布,我们跟着他们一起做布局。现在,风电和零售业务已经在四个国家和地区落地了。”柯严在采访的最后说道。


扩博智能补充资料如下:


商业化


在风电行业,2018年10月,扩博智能发布风机叶片全自动巡检新品,正式提出“全自动”的风机叶片运维服务。并宣布与双瑞风电和上海电气等国内知名风电厂商达成战略合作协议;


2019年2月,扩博智能宣布与欧洲最大的风机运维商GEV达成战略合作共同拓展欧洲、北美、非洲等国际市场。


在零售领域,扩博智能已与可口可乐等国际知名零售品牌在全球多个地区建立战略合作,所供方案已在北美、东南亚等四个市场落地。


团队


扩博智能由四位前微软高管创立,成立于2016年11月。他们分别是创始人兼CEO严治庆,前微软大中华区副总裁;联合创始人兼CTO柯严是卡耐基梅隆大学机器视觉领域方向的博士, 曾经是微软Bing search的在美国总部的研发团队负责人,将微软Bing搜索业的市场份额从8%做到21%;


联合创始人兼CRO李炤在微软公司工作10年,专注商业解决方案构建与销售;联合创始人兼COO陈丽苹也曾经是严治庆在Microsoft Azure业务团队中的伙伴,负责在中国地区落地及运营微软Microsoft Azure和 Office365业务。


*本文系黑智原创,作者李夜。黑智,关注AI落地与AI商业价值。



黑智专访


驭势科技 吴甘沙  搜狗 王小川

云知声 黄伟  格灵深瞳 赵勇

出门问问 李志飞 Roboteam Yossi Wolf

小鱼在家 宋晨枫  奇点机智 林德康

Rokid  Misa  瑞为智能 詹东晖

极限元智能科技 雷臻  乂学教育 栗浩洋 

 暴风科技 冯鑫 销售易 史彦泽

普强信息 何国涛 真机智能 刘智勇

纳人 姜海峰   众趣科技 高翔

拍拍赚科技 汤劲武  图森未来 陈默

智齿客服 徐懿  深之蓝 魏建仓

扩博智能 严治庆 视见医疗 王峰

  甘来 曹文斌  ROOBO 刘颖博

银河水滴 黄永祯 知盛数据 王晓梅

所问数据 颜鹏 趣链 李伟

云脑科技 张本宇 品友互动 黄晓南

擎朗智能 李通 百分点 苏萌

飞步科技 何晓飞  物灵科技 顾嘉唯

臻迪科技 郑卫锋 极米科技 钟波

蓝箭航天 张昌武 Roadstar.ai 佟显乔

e换电 黄嘉曦 智芯原动 崔凯

悉见科技 刘洋 


投资人说


云启资本 黄榆镔  松禾远望资本 程浩

英诺天使基金 李竹  线性资本 王淮

九合创投 王啸  纪源资本 肖鸿达

戈壁创投 徐晨  百度风投 刘维

明势资本 黄明明 


登录查看更多
0

相关内容

Bing(中文名:必应)是微软公司于 2009 年 5 月 28 日推出,用以取代 Live Search 的全新搜索引擎服务。
【斯坦福CS520】向量空间中嵌入的知识图谱推理,48页ppt
专知会员服务
100+阅读 · 2020年6月11日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
电力人工智能发展报告,33页ppt
专知会员服务
126+阅读 · 2019年12月25日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
图说报告 | “智能+”的终极版图:数字孪生世界
人工智能学家
22+阅读 · 2019年8月20日
人机交互如何改变人类生活 | 公开课笔记
人工智能头条
4+阅读 · 2018年7月9日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
使用人工智能增强人类智能(下)
论智
5+阅读 · 2017年12月9日
【新零售】当下趋势:传统零售将变革为新零售
产业智能官
3+阅读 · 2017年11月12日
AI世界:2018年八大趋势
CSDN云计算
6+阅读 · 2017年10月20日
【智能制造】离散型制造业如何实现智能制造​
产业智能官
7+阅读 · 2017年10月16日
自然语言处理在人机对话中的应用
京东大数据
8+阅读 · 2017年8月11日
Arxiv
7+阅读 · 2018年3月21日
VIP会员
相关VIP内容
【斯坦福CS520】向量空间中嵌入的知识图谱推理,48页ppt
专知会员服务
100+阅读 · 2020年6月11日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
少标签数据学习,54页ppt
专知会员服务
196+阅读 · 2020年5月22日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
电力人工智能发展报告,33页ppt
专知会员服务
126+阅读 · 2019年12月25日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
相关资讯
图说报告 | “智能+”的终极版图:数字孪生世界
人工智能学家
22+阅读 · 2019年8月20日
人机交互如何改变人类生活 | 公开课笔记
人工智能头条
4+阅读 · 2018年7月9日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
使用人工智能增强人类智能(下)
论智
5+阅读 · 2017年12月9日
【新零售】当下趋势:传统零售将变革为新零售
产业智能官
3+阅读 · 2017年11月12日
AI世界:2018年八大趋势
CSDN云计算
6+阅读 · 2017年10月20日
【智能制造】离散型制造业如何实现智能制造​
产业智能官
7+阅读 · 2017年10月16日
自然语言处理在人机对话中的应用
京东大数据
8+阅读 · 2017年8月11日
Top
微信扫码咨询专知VIP会员