原来早就被安排了,旅行社用机器学习给你推个性化定制游

2018 年 9 月 29 日 人工智能头条


大家好,我是为人造的智能操碎了心的智能禅师。

全文大约1700字。读完可能需要好几首下面这首歌的时间

👇


还有两天就是国庆长假了,这两天的天气也是格外的好。上班路过一个大厦,顺手拍了一张👇


艳阳高照,紫外线还是比较高的。恰巧今天也是国际蕾丝节,禅师建议咱们的女粉丝们,国庆出行可以买个蕾丝的遮阳伞;男粉丝……也可以。


很多人估计和禅师一样,准备利用这7天时间好好的出去玩一趟。💪

当然,也有很多人和条子一样,准备利用7天时间好好测试一下家里床的质量和舒适度…这人真的是没救了。🤷‍♀️

虽然还没开始放假,禅师身边很多同事都已经在路上了…你们这么不热爱工作的吗?🤷‍♀️

现在的年轻人出去旅游,很少有跟团的,大多选择自由行或者个性化定制的旅行产品。

难题

世界这么大,我想去哪儿呢?

每次国庆之前,禅师都会为这个问题伤脑筋。借用阿里副总裁周靖人的口头禅,这个简简单单的问题,背后牵扯到非常多的相关因素。

就拿选择目的地来说,背后涉及到的因素可以大致分为几类:食宿、交通、距离、景点、娱乐项目、保险、健康等。

如果选择境外游,还需要考虑网络、手机信号、货币兑换、意外情况等。

所以做攻略,是一项非常让人头痛的事情,比洗碗还让人头痛。咱们这已经进入人工智能时代了,这种事情,不是应该交给人工智能去做吗?是的,旅行社也是这么想的。

人工智能时代的旅行社,不再是以前那种坑爹的 X 日游。他们也在积极和技术厂商合作,利用机器学习为游客提供更让人欲罢不能、欲仙欲死、欲壑难填的旅游产品。

数据收集

我们先来看一张图:


这张图来自专做旅行技术研发的 Altexsoft 公司。他们从2007年开始,面向美国以及全世界的旅游中介,提供数据处理和解决方案,并提供技术支持。

从图中可以看出,实现个性化定制,需要经历6个步骤,分别是:提供丰富内容;收集数据;细分用户;预测用户偏好;个性化推荐;获得反馈。

提供丰富、有价值的内容

根据旅游网站 Expedia 的数据,在订购一款产品前,消费者平均要访问4.4个独立网站,浏览38个页面。

Sabre 报告显示,65%的旅客希望看到卖家提供的详细信息。例如飞机准点率、机上设施、酒店客房服务和设施等等。


数据收集

首先通过元数据来绘制用户画像。元数据包括以下数据:

  1. 用户位置

  2. IP地址

  3. 浏览器类型和版本

  4. 设备型号

  5. 操作系统

  6. 屏幕分辨率

  7. 联网类型(WiFi、LTE还是LAN)

  8. 会话时长

  9. 推荐来源( Google 百度?微博微信?马蜂窝?携程广告?…)

接下来通过用户行为数据,获得消费者洞察。用户行为数据有很多种,比较重要的有:

  1. 搜索目的地

  2. 选定的日期或者匹配可变的合适的日期

  3. 滚动的深度

  4. 鼠标点击和悬停(特别是包括了设施、附加服务、位置数据、评分和评论信息的点击和悬停)

  5. 低价提醒

通过这些数据就能够分析出,消费者最看重什么,有什么样的喜好等。这些用户行为数据,对消费者洞察有着非常重要的价值,但不如元数据可靠。

然后是客户关系管理(CRM)数据地理位置数据社交媒体数据

客户关系管理(CRM)数据对个性化来说至关重要,包括:

  1. 姓名、登录凭证、联系信息

  2. 消费细节和历史记录(包括网站访问次数和时间等)

  3. 住宿类型或飞行类型

  4. 实际的服务偏好,如客房服务和附加服务

最后,还可以通过第三方数据,比如 TripAdvisor(猫途鹰) API 来收集用户反馈的数据。

地理位置数据可以获得用户的位置信息,就可以发送与位置相关的信息。比如消费者10点才来 check in,已经过了酒店的早餐时间,就可以基于用户当前的位置,推荐附近的餐厅。

社交媒体数据是将用户画像做的更立体、更完善的关键数据。其他途径很难收集到的个人偏好数据,而用户却会在社交媒体分享他们的旅行体验。

一般来讲,社交媒体数据包括以下内容:

  1. 评论的情感文本分析

  2. 照片、视频或故事分享,这些信息可能附有地理位置标记

  3. 关于某件事的讨论意见

  4. 在机场、酒店或餐厅中的登记手续

细分用户

早期的用户细分完全是靠人工来做,所依赖的是旅行社销售个人的经验和洞察。所以禅师认为这才是真正的“人工智能”。

顶级的销售是能够通过在和游客接触的过程中察言观色,根据游客的言谈举止迅速了解游客的喜好,然后看人下菜碟。


比如发现游客是个富二代,带着新交的女朋友去参加世界三大狂欢节之一的尼斯狂欢节(le Carnaval à Nice),就可以推荐豪华情趣酒店、皇家游艇等;如果发现是个独自旅行的背包客,就可以推荐一些自然景观、人文景点等。

到了人工智能时代,显然上述的方式是比较低效而且昂贵的。首先你需要一个有这份丰富经验的销售,而这样的销售必然价格不菲。

通常来说,有两种比较常用的方式,可以在产品层面上,做出类比传统旅行社销售的效果来。

  1. 使用显式数据。比如将自由行游客和团体游客分开,或按目的地细分(热门和非热门)

  2. 利用数据挖掘技术。通过使用无监督学习技术(如聚类),对收集到的数据进行自动分组,从而有可能发现以前没想到、或者无法区分的游客群体

预测

收集数据相对而言比较简单,而预测就难很多了。需要设计机器学习引擎,合理设计机器学习模型。

通常有下面几种解决方案:

1. 评分分组

第一次用旅游产品的新用户,没有在数据库里留下任何可供分组的数据,机器学习怎么预测他的偏好呢?

可以在产品层面,给用户的行为设定分数,不同的分数匹配不同的类别。这样用户只要在产品上停留时间足够长,系统就能获得足够的数据对用户进行分类。

当然,用户停留时间越长,产品能够获得的用户数据就越多。所以这也是上述数据收集模块中,步骤1为什么很关键的原因。

2. 内容过滤

内容过滤应该是目前在旅游业使用最广泛的方式。基于已有用户数据,预测细分人群的偏好。


比如商旅人士对酒店的稳定 WiFi、便捷的洗衣服务比较注重。那么机器就可以将收集到的有稳定 WiFi、便捷洗衣服务的酒店推给客户。

但这个时候推荐的内容,是基于已有用户的个性化数据,还不算是完全的个性化,可以认为是针对整个特定群体的泛个性化。

3. 协同过滤

但酒店还有一些因素,通过上述基于内容过滤的方式没办法获得。比如酒店服务员今天心情不好导致态度很差、设施突然出现意外、今天酒店后厨进的食材有问题等等。这个时候就可以使用协同过滤

协同过滤的核心思想是“物以类聚人以群分”:跟你需求相近、住过同一家酒店,甚至中午刚吃过你晚上要点的菜,你们就是同一国的,那么ta喜欢的,很可能你也喜欢。

这种方法涵盖了机器学习的各种方法,其中最常见的是矩阵分解。矩阵分解成每个用户的档案矩阵,并基于来自用户矩阵的信息填充一个矩阵中的缺失值。


协同过滤技术是目前先进技术之一,它已经成为多个行业推荐系统的主流。例如Netflix的推荐系统中就是用了这一技术,因为电影除了类别以外,没有其他的明确属性。

协同过滤也可以用于类似旅游行业这种没有足够的外显特征的服务中,例如餐厅、景点、名胜古迹、旅游主题等。

我们用一张对比图来总结一些这三种方法:

当然不可能一种方法天下通吃。一般都是几种方式互相掺杂的混合技术

例如,使用评分技术提出基本建议,或者仅使用评分技术来进行初始细分。然后针对不同属性的产品,同时使用协同过滤和基于内容的过滤,来提供更好的预测和推荐。

多种渠道

个性化是给非常复杂的事情,需要通过多种渠道来实现个性化。

  1. 个性化的搜索引擎。当游客寻找酒店或航班时,系统会根据以前的行为提出个性化的建议

  2. 个性化的电子邮件。鉴于数据科学的基础工作已经完成,这是一个相对简单的方法。根据 eMarketer.com 的调查,在不同行业中,80%的个性化推荐是通过电子邮件传递的,这也可以扩展到社交媒体和短信

  3. 个性化促销。给愿意花钱买你产品的用户优惠、特权

  4. 个性化旅途中的推荐。如果你能获取地理位置数据,则可以向用户发送有关附近餐厅的通知,或者提供相关的航空旅行服务

结语

不知道大家有没有这种感觉,就是面对一个旅行社,总觉得是在想法设法的坑你的钱。旅行社的销售人员表现的再怎么诚恳,也很难完全获得游客的信任。

但是面对机器、面对一个旅行产品的时候,人们反而更容易放下戒备,接受引导。

所以这次国庆出行,禅师准备上高速卖炒饭去,有人一起的吗?





幸福

无非就是

我 & 你

我  AI  你





声明:

  1. 本文图片均来源网络,如有侵权请告知

  2. 这篇文章的英文链接被腾讯认定有风险无法添加



登录查看更多
0

相关内容

【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
194+阅读 · 2020年6月29日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
你用 Python 做过什么有趣的数据挖掘项目?
计算机与网络安全
4+阅读 · 2018年2月11日
如何运用Python建一个聊天机器人?
七月在线实验室
17+阅读 · 2018年1月23日
Python除了不会生孩子,其他的都会了!
全球人工智能
3+阅读 · 2017年11月9日
Python除了不会生孩子,什么都会
算法与数学之美
3+阅读 · 2017年11月8日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
谈谈用户画像
caoz的梦呓
10+阅读 · 2017年8月17日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Arxiv
24+阅读 · 2018年10月24日
Arxiv
4+阅读 · 2018年9月6日
Next Item Recommendation with Self-Attention
Arxiv
5+阅读 · 2018年8月25日
Arxiv
6+阅读 · 2018年5月18日
VIP会员
相关资讯
我是怎么走上推荐系统这条(不归)路的……
全球人工智能
11+阅读 · 2019年4月9日
你用 Python 做过什么有趣的数据挖掘项目?
计算机与网络安全
4+阅读 · 2018年2月11日
如何运用Python建一个聊天机器人?
七月在线实验室
17+阅读 · 2018年1月23日
Python除了不会生孩子,其他的都会了!
全球人工智能
3+阅读 · 2017年11月9日
Python除了不会生孩子,什么都会
算法与数学之美
3+阅读 · 2017年11月8日
京东用户画像揭秘:原来买iPhone X的是这么些人
R语言中文社区
10+阅读 · 2017年9月14日
谈谈用户画像
caoz的梦呓
10+阅读 · 2017年8月17日
Top
微信扫码咨询专知VIP会员