机器学习能为你的业务做什么?有些事情你肯定猜不到!

2017 年 8 月 16 日 云栖社区

摘要:机器学习是一项令人难以置信的技术,你需要了解很多很多的基础知识,以使得业务功能尽可能的不受复杂算法的影响,让你能够提出正确的问题、了解机器学习模型开发过程、成立一个团队以促进学科间的不断合作,而不是把数据科学视为一个产生奇迹的黑匣子。



每一个产品经理、企业家或商业领袖都应该让自己的项目或企业在机器学习方面加速发展。如果你还没有建立起下一个代的聊天室或自动驾驶汽车,那么你需要加快引入机器学习的进度,以保持较强的竞争力。有一个好消息,对于机器学习,你无需自己发明,只需利用现成的就可以了。一些技术公司已经提供了开源的工具和平台(Amazon AI,TensorFlow, 和许多其他工具),使得任何公司在今天都可以使用机器学习。


当我初次踏入机器学习门槛的时候,我对此几乎一无所知,但是在很短的时间里,我就能以机器学习为技术核心指挥产品的开发了(就像这个)。本文的目标是让你充分了解开发机器学习产品的技术和流程,让你快速入门。 这是一个循序渐进的教程,它能让你成为一名能够利用机器学习实现业务目标的产品经理。


本教程包含六个部分:


1. 机器学习能为你的业务做什么
2. 关于机器学习算法你需要了解什么关心什么
3. 开发机器学习模型全过程
4. 机器学习产品团队的角色、技能和组织结构
5. 机器学习就是一个用户体验问题
6. 产品经理应该注意的工程问题


下面我们将开始第一部分:机器学习可以为你的业务做什么。


投身到机器学习的大潮中去,

就像十年前投身到移动技术中一样,它能让你实现业务转型

通过查询已有的数据来获得见解是一个众所周知且广泛适用的方法。机器学习是数据分析方面的下一个前沿领域。计算机程序首先从众多数据中分析识别出一定的模式,然后根据该模式进行预测或得出见解,同时,通过以往的经验可以对这些见解进行改进。在这整个过程中,无需有人去明确地告诉计算机该如何做。由于机构组织可以获得更多的数据,所以他们能够通过机器学习技术从大规模的数据中获取见解,粒度级别从单个用户的交互到全球趋势以及它们对地球的影响。


使用这些见解还可用于定制个人用户之间细微差别的使用体验,也可用于创造新的产品寻找新的商机。请注意,要利用机器学习,不仅要使用内部数据,还要将外部数据与内部数据相结合,以增强机器学习的功能,从而推动以前无法实现的新见解的实现。


来自于A16Z这个顶级风投公司的Frank Chen对人工智能的潜在应用做了一个很好的介绍,而其中有许多应用需要利用机器学习技术来实现。这些应用程序中有一些是未来的,用现有的技术暂时无法实现,但仍具有无限的可能。


就像消费者行业在8-10年前投身到移动设备那样,现在是公司探索机器学习技术来帮助推动商业成果发展的时候了。针对那些专注于利用现有机器学习技术的公司,下面罗列了几个机器学习的关键用途。这里讲得比较简单,相互之间也并不是互斥的,而是从不同角度对业务潜在影响的思考:


  • 定制化的用户环境、使用体验和系统响应。想象一下,人们所做的或看到的一切都可以进行特别的定制,甚至可以预见用户的需求和行为。这包括针对产品或服务的推荐,按照相关度进行排列;根据用户的知识、行为、喜欢他们的人或外部数据来定制用户体验或流程,包括预测他们下一步要做什么。在较小的范围内,这可以转化为针对某个用户群体而不是单个人的体验进行定制化。


  • 视觉识别物体的能力,并据此实现自动化或定制使用体验。当今的技术可以识别照片和视频中的对象,包括识别摄像头中的实时视频。Pinterest(一款图片app,堪称图片版的Twitter)使用这项技术来推荐与用户当前正在看的照片相似或者互补的照片;Facebook使用脸部识别技术在照片中标记并推荐朋友;亚马逊正在建立基于对象视觉识别的自动存储检测系统。


  • 内容的自动检索、生成或处理。 利用机器学习可以很方便地处理世界上大批量的内容。其常见用途是文件检索,例如,查找与法律案件相关的所有文件(请注意,这不仅仅是根据关键字到上下文中搜索)、按主题和关键字对文档进行分类、自动对内容提取摘要,从大量内容中提取相关信息,例如,在供应商合同中查找某个具体的条款等等。这里的“内容”适用于所有类型的媒体,而不仅仅是文本。


  • 一定规模的预测、估计和趋势。 在以前,进行预测需要有高水平的专业知识,不仅昂贵,而且难以实现。而机器学习对预测来说非常有用,它可以实现一些人类无法实现的功能。例如,机器可以识别数据潜在的变化趋势。


  • 检测异常活动或系统故障。每个系统都会发生错误出现问题,而机器学习不仅能帮你检测是否出现了问题,还能告诉你这些问题是否是不寻常的,并且及时告警。这在各种监控安全软件中特别有用。


从战略的角度来看,机器学习可以促使出现这几种商业成果:


  • 为你的客户增强体验和功能。最常见的案例是大规模的定制化,即更快更准确的找出与你的客户最相关的产品,例如约会网站上的最佳匹配、音乐网站上可能喜欢的歌曲、购物网站上可能感兴趣的商品。另一个案例则是通过预测来获取以前得不到的情报, 例如Zillow对房地产的估价,又或者是针对个人客户的定制化服务,例如根据用户特定的口味对用户还没有看的电影进行评分。


  • 内部功能、流程和业务逻辑。机器学习可以节省你的时间,使你的资源投入在业务流程和决策方面更有效。例如:借贷公司希望优先考虑潜在借贷人。它需要确定谁想要一笔贷款,如果提供的话,对方是否能够到期偿还。优先考虑信誉最高的客户不一定是借贷公司想要的答案,因为这些客户通常有很多选择,所以需要一个更复杂的模型。


  • 扩展到新的领域和新的产品。数据可以帮助你开辟全新的商机,为现有客户创建全新的产品,或为你之前从未服务过的细分市场或客户提供服务。例如,Netflix可以为不是核心目标受众的电影工作室提供服务,向他们出售有关哪些观众喜欢哪些主题或者情节的数据;Zillow可以帮助房地产开发商了解哪些建筑功能可以得到最高的投资回报,等等。


首先针对哪个领域,应取决于潜在的商业影响、问题的复杂性以及实现这一影响的成本。


“我们需要用数据来做某事”是一个策略,

而不是数据科学,或是一个问题

许多公司正在招聘能够构建机器学习模型的数据科学家,因为“我们应该用数据来做某事”。我听说过许多知名公司的高管都说“我们看到竞争对手购买了数据,所以我们也需要这样做才能保持竞争力”,然后他们聘请了几位数据科学家,希望能看到一些惊喜。这让我对机器学习产生了很大的误解。


机器学习并不是你生意上的魔法棒。在利用机器学习的过程中,遇到第一个挑战是弄清楚由技术驱动的业务影响。机器学习是一种解决方案,你需要首先定义问题:您希望用机器学习实现的业务结果是什么?机器学习能为你的客户带来什么好处? 机器学习是一把锤子,但是如果你没有钉子,锤子并没有什么用处。引申一下,机器学习是一套各不相同的锤子,你所选择的钉子将决定你该选择哪个锤子以及如何使用它。你要解决的问题决定了所有一切:结果该如何使用、你的模型能预测出什么结果以及如何校准、应该收集和处理什么样的数据,该使用怎么样的测试算法以及许多其他问题。


其核心“我们要解决什么问题?”是一个商业问题,这意味着最终确定这个问题答案的是产品经理和业务主管而不是数据科学家的。数据科学家和其他利益相关者应该也参与进来,只是不要把问题抛给他们,期望他们来回答这个问题。如果你有数据,但你不知道该怎么用这些数据,请与客户进行交流。数据科学家可以帮你探索数据,但他们很难提出自己的商业案例。为了最大限度地发挥机器学习的商业价值,你需要让产品经理和数据科学家之间互相协作,产品经理有责任确保解决的问题能对业务产生最大的影响。


解密机器学习如何推动你的业务向前发展

虽然机器学习有着无限的可能,但对于技术是如何应用于团队这个问题,你可能会有几个疑问想弄清楚。这里有几个例子:


内部流程


  • 公司人员今天用于决策的知识哪些可以自动化?这样他们的技能就可以在其他地方得到更好地利用。


  • 公司人员一般在信息库中搜索、收集或提取哪些数据,这些操作如何自动化?


  • 公司做出的一系列决定是什么?如果机器获取到公司人员所能获取到的所有数据,是否也能做出这些决定?


针对现有客户的产品和体验


  • 客户交互的哪些部分是由人来定制的,是否可以交给机器来定制?


  • 是否根据喜好、行为和需求对客户进行了细分?产品或体验是否为每个细分客户群进行了定制?


  • 是否可以根据自己对客户的了解或客户与网站/应用/产品的交互来为每个客户定制体验?如何为客户创造一个更好、更快、更愉快的体验?


  • 具体来说,今天需要客户做出怎样的决定或选择?


  • 基于我已经拥有或可能拥有一些知识,这些决策能否可以自动化?


  • 如何更好地识别出好的或坏的客户体验?对客户体验或满足感产生负面影响的问题是否可以提前发现?


新的领域或客户


  • 我手里是否有一些对本行业或者相关行业中其他利益相关者有用的数据?这些数据可以帮助他们做出什么样的决定?


综上所述


  • 哪些指标或者趋势如果我正确预测了就能对我服务的客户或者行业中的竞争对手产生深远的影响?比如,预测某些类别产品的需求、成本波动等等?


  • 收集的数据的关键实体是什么(人、公司、产品等等)?可以将这些数据与任何外部数据(来源于公共来源、合作伙伴等)结合起来,得出有关这些实体一些新的或有用的东西吗?对谁有用,以及如何使用?比如,在人们在查找你的产品的时候识别出潜在客户、了解外部因素如何影响行业需求并作出相应的反应。


请与团队以及组织中主要的利益相关者一起讨论这些问题。如果你不知道从哪里开始,就从随便某个地方开始吧,只要让数据对你或者你的团队产生一定的帮助作用。


文章原标题《What Machine Learning Can Do for Your Business and How to Figure It Out》,作者:Yael Gavish,译者:夏天,审校:主题曲哥哥。


往期精彩文章

0 “NetSarang的Xmanager和Xshell多种产品被植入后门事件”分析报告

1 阿里云大学免费课程:怎样学好C语言?从入门到实战

2 分布式机器学习平台比较

3 万亿级数据洪峰下的分布式消息引擎

4 阿里云专家风移“出诊”记录:SQL Server 疑难杂症解决之道(上篇)


-END-

云栖社区

ID:yunqiinsight

云计算丨互联网架构丨大数据丨机器学习丨运维


点击“阅读原文”


登录查看更多
0

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
340+阅读 · 2020年3月17日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
领域应用 | 到底什么时候使用图数据库?
开放知识图谱
16+阅读 · 2019年4月19日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
机器学习不能做什么?
引力空间站
5+阅读 · 2018年3月28日
机器学习:从入门到绝不放弃!
图灵教育
5+阅读 · 2018年3月19日
为什么 Python 更适合做 AI/机器学习?
计算机与网络安全
10+阅读 · 2018年3月18日
关于机器学习,你需要知道的三件事!
云栖社区
3+阅读 · 2018年3月3日
Arxiv
6+阅读 · 2018年8月27日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年4月29日
VIP会员
相关VIP内容
相关资讯
领域应用 | 到底什么时候使用图数据库?
开放知识图谱
16+阅读 · 2019年4月19日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
机器学习不能做什么?
引力空间站
5+阅读 · 2018年3月28日
机器学习:从入门到绝不放弃!
图灵教育
5+阅读 · 2018年3月19日
为什么 Python 更适合做 AI/机器学习?
计算机与网络安全
10+阅读 · 2018年3月18日
关于机器学习,你需要知道的三件事!
云栖社区
3+阅读 · 2018年3月3日
Top
微信扫码咨询专知VIP会员