九章云极:用数据科学推动企业AI落地 | 初创公司

2019 年 10 月 10 日 动点科技


动点科技 | ID:technode


信息时代大数据被广泛运用,数据科学家已经成为企业中常见的职位,很多企业已经组建出独立的大数据部门。 而随着数据团队的不断壮大,数据科学家和工程师之间如何高效顺畅地协作成为一个难题。


九章云极的创始人方磊在微软工作期间发现了这个数据行业的痛点,看到了数据科学平台的蓝海。 2011 年,方磊开始在微软 Bing 搜索部门工作,先后担任过数据科学家和数据工程师。 他发现 Bing 内部 800 多个数据工程师在一个名为 Aether 的系统上协作,这个平台包含一万多个模块和几十万个项目,而整个团队能够有序地在同一个平台进行协作,并且具备管理、资源调配和提高工作效率等诸多功能。


2013 年,方磊决定回国创业,在北京中关村创立了九章云极科技公司,希望搭建一个给数据科学团队使用的协作办公平台,帮助企业的数据科学家和数据工程师更好地协作。


企业数据的价值正在发生转变


目前在大多数企业中,数据的价值主要体现在进行粗浅的数据分析,将数据做成包含饼图、折线图等的可视化报表,进而指导业务。 而随着企业积累的数据越来越丰富,对数据分析的要求越来越高,过去的数据分析方式已经不能满足企业的需求。


方磊认为,企业数据的价值正在发生转变,数据分析进入了 “增强分析” 阶段,即通过机器学习或者人工智能增强数据分析能力。 以往的可视化分析是通过视觉呈现产生洞察,但通过人工智能技术分析产生的洞察更强大,比如通过模型分析金融反欺诈中的数以亿计的交易。


在这个大环境下,九章云极推出了 DataCanvas 数据科学平台,希望帮助企业应用 AI 进行智能化转型。


为了降低企业应用 AI 的难度,DataCanvas 提供了完整的机器学习平台和 AI 模型生产化平台,将数据清洗、特征工程、模型训练等一系列高难度的数据模型工作自动化。 使用者不需要具备专业的数据科学背景和编程算法能力,只需借助 DataCanvas 数据科学平台上的 AutoML 建模功能,即可完成海量数据处理和数据模型全生命周期管理。


DataCanvas 更强大的功能还体现在实时数据处理上。 例如,在每天生成海量数据的金融行业,实时数据决策的需求尤为迫切: 在刷信用卡的一刹那判断出是否是盗刷,在瞬息万变的股市中计算出最佳投资方案……都需要借助实时数据处理来保证。


“九章云极的核心是把数据变成模型,为客户提供模型能力的技术工具或服务,以支撑各类商业场景。 ” 方磊说道。


知识融合推动规模化企业 AI 落地


对于数据科学的发展趋势,方磊认为技术的壁垒是在不断降低的,现阶段更重要的是普及应用。 “降低技术门槛已经不是数据科学发展的核心难题,核心难题是如何将技术与现实场景中的业务结合起来。 ” 方磊表示。 如何高效共享专业知识,如何将行业经验、业务知识和数据科学、人工智能有效结合,并最终实现在业务场景中,是企业在人工智能浪潮中共同面对的技术落地难题。


针对这一难题,方磊提出了 “知识融合” 的概念。 “我们人类的很多常识是跟业务相关的,机器学习在某些方面可以洞察出微妙的数据信息,但有些还是需要依赖人的技能。 ” 方磊表示,“建立一个模型,技术在其中占 30% 到 40%,剩下的其实是业务知识。 ” 他列举了金融应用中的一个场景: 比如小微贷款模型需要考察企业的隐形负债风险,有经验的审计要考察的第一项是借贷是否拆整为零,如果公司收到不同账号的整额打款,就可能有隐藏的负债风险。 这需要人的常识性经验来做判断,需要人把这样的经验变成机器学习里面的一个特征,机器学习就可以做出相应的风险告警。


在实际操作中,九章云极为企业落地 AI 提供了 “四库” 解决方案: 通过建立 “四库”——模型仓库、特征仓库、场景模版仓库和 AutoML Recipe 仓库,解决企业业务知识与技术知识融合的难题。 数据分析、建模的门槛降低以后,企业的 AI 应用成本也相应地降低,就能在更多的业务场景中应用 AI。


目前,九章云极不仅在金融行业反欺诈、精准营销等场景有丰富的实践经验,在政府、交通、IoT、地产、教育等领域也在不断落地机器学习的创新应用。


在服务政府的一个案例中,九章云极与山东省青岛市人民检察院合作了 “案件质量评查系统建设项目”。 利用 DataCanvas 数据科学平台,通过运用机器学习算法、模型训练等技术实现智能案件评查,将人工办案的工作量下降 80%,效率提升 80%。 以往评审类案件由于人力的限制只能抽查 10%-20%,而借助人工智能技术可以做到 100% 全部评审。


服务全球客户,是方磊接下来的目标。 他判断中国的 To B 业务出海在 3 到 5 年以后会慢慢成为主流。 随着云计算的发展,全球很多大公司的数据业务都在云上。 “云可以成为一个入口,在云上我们就可以去提供全球服务和参与竞争了。 ” 方磊认为 ToB 业务的出海一定会经历这个过程。


2018 年 3 月,九章云极进行了 B 轮近亿元融资,由红点创投、东方富海等机构参与。 2017 年 1 月实现了 5000 万元 A 轮融资。


- - - - - - - -   END   - - - - - - - -


推荐阅读


点击图片即可阅读往期文章


中阅互娱:让知识服务与文化地产擦出火花


- - - - - - - -   END   - - - - - - - -


登录查看更多
0

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
专知会员服务
125+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
197+阅读 · 2020年3月8日
电力人工智能发展报告,33页ppt
专知会员服务
130+阅读 · 2019年12月25日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
304+阅读 · 2019年12月23日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
123+阅读 · 2019年10月10日
医疗知识图谱构建与应用
专知会员服务
385+阅读 · 2019年9月25日
领域应用 | 企业效益最大化的秘密:知识图谱
开放知识图谱
8+阅读 · 2019年4月11日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
微软开源项目提供企业级可扩展推荐系统最新实践指南
微软研究院AI头条
4+阅读 · 2019年2月25日
企业数据AI化战略:从数据中台到AI中台
36大数据
11+阅读 · 2019年2月18日
数据科学即将迎来“无代码”时代
大数据文摘
4+阅读 · 2018年10月21日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
2017全球大数据产业八领域典型公司盘点分析
人工智能学家
3+阅读 · 2017年12月6日
【人工智能】人工智能5大商业模式
产业智能官
16+阅读 · 2017年10月16日
Adversarial Metric Attack for Person Re-identification
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
Arxiv
12+阅读 · 2018年9月5日
Arxiv
10+阅读 · 2018年2月9日
Arxiv
7+阅读 · 2018年1月24日
VIP会员
相关VIP内容
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
专知会员服务
125+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
197+阅读 · 2020年3月8日
电力人工智能发展报告,33页ppt
专知会员服务
130+阅读 · 2019年12月25日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
304+阅读 · 2019年12月23日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
123+阅读 · 2019年10月10日
医疗知识图谱构建与应用
专知会员服务
385+阅读 · 2019年9月25日
相关资讯
领域应用 | 企业效益最大化的秘密:知识图谱
开放知识图谱
8+阅读 · 2019年4月11日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
微软开源项目提供企业级可扩展推荐系统最新实践指南
微软研究院AI头条
4+阅读 · 2019年2月25日
企业数据AI化战略:从数据中台到AI中台
36大数据
11+阅读 · 2019年2月18日
数据科学即将迎来“无代码”时代
大数据文摘
4+阅读 · 2018年10月21日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
2017全球大数据产业八领域典型公司盘点分析
人工智能学家
3+阅读 · 2017年12月6日
【人工智能】人工智能5大商业模式
产业智能官
16+阅读 · 2017年10月16日
相关论文
Top
微信扫码咨询专知VIP会员