编者按:Altexsoft公司是一家数据处理和解决方案提供商,利用技术为多家企业定制了有效的商业计划。本文总结了机器学习在旅游业中的用处,介绍了数据的收集到利用的各个阶段,为旅游从业者提供了全面的建议。以下是论智对原文的编译。
当我们浏览各大视频、购物网站时,总会收到与我们息息相关的推荐信息。其实这种推荐技术已经不是什么新闻了,论智曾编译过国外开发者分析Netflix推荐系统的博文以及音乐软件Spotify的推荐算法,解释了背后蕴涵的技术原理。它们好像能读懂我们的内心,总能推荐适合的产品。旅游业也是如此,但却不完全相同。
旅游技术公司Sabre的统计数据显示,69%至75%的游客对个性化旅行非常满意,虽然这种服务在整个行业还未普及,但已经成为许多企业发展的目标,也是旅游行业会议上的关键议题。行业现在有两大趋势:
从业者听说过定制旅行的服务,但对其中的技术了解不多;
一些运用了顾客定制化技术的公司收到了不错的效果,即使只有一些小功能。
目前看来,这一领域存在技术空白。利用个性化技术的公司很有可能在将来实现业务的明显提升,保持领先的竞争力。本文就将探索如何利用在线旅行产品、酒店或航空公司的应用程序来成功定制个性化的旅行体验。
个性化能够让软件调整自己来为特定客户提供服务。在这里,我们只讨论数字和自动化定制。以下是个性化的各个阶段。
下面让我们详细讨论各个阶段的具体实现过程。
网站内容丰富并有用才是最好的。顾客通常经过深入调查后才进行与旅行有关的消费,根据旅游网站Expedia的数据,在订购一款产品前,消费者平均要访问4.4个独立网站,浏览38个页面。上文提到的Sabre报告中显示,65%的旅客希望看到卖家提供的详细信息,例如飞机准点率、机上设施、酒店客房服务和设施等等。因此,吸引顾客在你的网站上浏览大量信息是明智的做法。但从个性化角度看,还有另一个原因。
个性化就是获取详细的用户行为数据,这些信息能让我们预测他将来想做什么。要收集这些数据,你首先要有足够的内容与用户沟通。你需要了解用户感兴趣的每条信息,以及它是如何影响最终选择的。
在酒店主页上,用户可以查看房间照片,了解相关信息,包括可否带宠物、入住和退房时间、评论、最近的地标和餐馆等等。
比如,你可能会发现对飞机设施感兴趣的用户可能是差旅人士,而非是休闲旅游的人。这只是一个单一变量,不足以得出明确结论,但是与其他信息结合起来,它能更精准地为用户分类,实现精确的个性化推荐。
数据类型
你需要跟踪的数据有好几处来源,以下是几种主流数据来源类型。
元数据。元数据是描述web会话技术方面最通用的信息,主要工具是Google Analysis,这样一来,你至少能知道:
用户位置
IP地址
浏览器类型和版本
设备类型
操作系统
屏幕分辨率
连接类型(WiFi、LTE还是LAN)
会话时间
来源(自然搜索、社交媒体、旅游搜索网站、广告等)
虽然元数据不够详尽,但它提供了大量信息来帮助绘制用户画像,并显示出他们的需求或兴趣。对于最终的个性化定制来说,这些数据还不全面,但它们是最可靠的。不过在任何特定的时刻,你都不会得到每个用户足够多的信息,总会有新用户或者清除了缓存的人。这个时候元数据是非常有帮助的。
想像一下,你正在了解一个酒店的实时搜索情况。如果你的访客都是看到一则推荐欧洲城市中心酒店的广告来的,那么这则信息足以让酒店在市中心的排名上升。
显然,只有元数据是不够的。
用户行为数据。这是您根据访问网站的每个用户的具体操作收集的数据,这一详细数据是实现个性化的关键。主要的变量有以下几种:
目的地搜索
旅行日期或灵活搜索
滚动深度
鼠标点击和悬停的位置(包括设施、附加服务、位置数据、评分和评论信息)
电子邮件订阅和活动(包括点击率)
订阅提醒(例如当某一目的地的价格最低时通知游客)
这些数据可以告诉你用户最看重什么,他们其他的喜好是什么等等。虽然这不是最罕见的数据,但它绝对是将您的个性化产品与其他产品区分开的最有价值的独特信息。
用户行为数据不如元数据可靠。如上所述,你可以收集它们,但在许多情况下,使用起来会更困难。最佳情况是,用户都登录了,并且你有每个访问者所有的历史数据,也可以使用cookies。但现实却不是这样的。人们可能不会登录,或者在没有登录的情况下用电话搜索航班或酒店,然后在电脑上购买。目前没有能将这两种绘画方式关联起来的方法。
CRM数据。这是客户在消费时产生的另一种最可靠的数据类型之一。如果您运营一家在线旅行社,那么大多数情况下都是与客户自动交流的。如果您经营一家连锁酒店,那么数据有可能是自动和手动的结合。CRM数据包括:
姓名、登录凭证、联系信息
消费细节和历史记录(包括网站访问次数和时间等)
住宿类型或飞行类型
实际的服务偏好,如客房服务和附加服务
CRM数据的优点在于,它至少能把一部分行为数据结合起来,如果用户没有登录,你可能会无法研究用户的行为数据,但是你可以在购买会话时获得用户行为。
地理位置数据。地理位置可以告诉你用户在任意时间的位置,一般精确到10米内。这种数据类型不易获得,大部分情况下,在一趟旅行中,你可以通过用户的手机或可穿戴设备获取这一数据。如果你知道用户在哪里,就能发送与位置相关的信息。如果你的客户刚入住酒店但已经过了早餐时间,那么你可以推荐附近的餐厅。
社交媒体数据。最终,您可以研究用户的社交媒体行为进行个性化。根据Amadeus网站介绍,90%的美国游客会在线分享他们的旅行体验,所以社交媒体充满了机会。数据类型主要有:
评论的情感文本分析
照片、视频或故事分享,这些信息可能附有地理位置标记
关于某件事的讨论意见
在机场、酒店或餐厅中的登记手续
这些数据能有效了解用户是否喜欢您提供的服务。但是如果能将用户与特定的社交媒体连接起来结果会更明显。如果用户通过他们的社交媒体账户登录也是可以的,不过要注意数据收集的法律限制。
数据统一
统一数据依赖于管理和技术工作。
管理者应该积极地促成各机构和部门的沟通,减少数据碎片,帮助建立从各渠道收集来的数据库。
对于技术人员来说,收集的数据应该统一,这并不意味着要从头开始构建所有的跟踪工具,通过Google Analytics收集的记录能满足元数据的需求,但是如果您选择所有可能变量进行深度跟踪,最好考虑自定义解决方案。首先,您需要设置一个复杂的REST API基础结构,并依赖可能不太稳定的第三方。其次,这种方法不可扩展。更对信息可阅读我们有关对未来数据处理的数据准备。
营销细分是广为人知的手段。营销人员使用诸如年龄、地理位置、性别、社会发展等因素,建立了几十年的用户概况和画像。如今,传统的特征列表还不足以概括现代用户,因为个性化可能涵盖数百个变量。
有两种方法可以生成客户群体:
1.使用显式数据。您可以通过显式数据变量细分客户。例如,可以将自由行游客和团体游客分开或按目的地细分(热门和非热门)。完成数据收集后,这些变量应该可用。您也可以直接询问用户一些细节。
2.利用数据挖掘技术。很多商用领域都利用数据科学的发展实现了许多进步。通过使用无监督学习技术(如聚类),你可以深入了解细分用户。无监督的方法通过查看现有的数据集,就能找到你从未考虑过或无法区分的用户群体。
当要预测用户的喜好时,事情就更加棘手。你必须建立能预测用户偏好的机器学习模型,最好能实时进行。
实现个性化时,通常有些一般和特殊行业的问题。一般问题与冷启动问题有关,这表示一个新用户没有留下足够的数据来为他提供个性化服务。特殊问题是指你没有收到更好的反馈来做更好的预测。与观众对电影打分的Netflix不同,旅行消费品通常没有嵌入到系统中的反馈工具。所以,让我们看看可用于旅游业的基本和高级的预测技术。
评分技巧和分类。评分方法的工作方式如下:用户的每个行为都会改变他的评分。不同的分数匹配不同的类别。几分钟后,系统获得足够的数据对用户进行分类。这解决了冷启动的问题,因为引擎可以基于原始数据进行预测。用户在网站停留的时间越长,算法分析的就越精准。这种技术可以通过基于决策树的方法加强,它能允许进一步对细分中的用户进行分类,特别是经常在网站进行回话。
决策树也可以基于元数据区分访问者。
评分和分类的问题在于,它们能处理好基本的个性化定制任务,你只需将客户分组,然后做出批量建议。例如,如果您想定制旅游网站上酒店的搜索,那么可以向商旅人士推荐价格更高的市中心酒店,向专门来旅游的游客推荐更便宜的房间。
基于内容的过滤。该方法基于用户产生的偏好数据和产品特征。例如,商务旅客可能对房间内稳定的WiFi和熨烫服务更感兴趣,因此这类算法试图匹配产品明确的特征和之前的偏好。
基于内容的过滤也许是旅游行业实现个性化的主要手段。住宿和航班总是有明显的属性,可以匹配游客个人的喜好。
但是这种方法的缺点是你会错过所有未包含在显式特征中的数据。例如态度差的服务员、脏乱的房间、糟糕的事物等都无法通过基于内容的工具过滤。
如果没有足够的产品数据进行预测,则可以应用基于对等的系统。
协同过滤。协同过滤的核心思想是向类似用户推荐这些项目。这种方法涵盖了机器学习的各种方法,其中最常见的是矩阵分解。矩阵分解成每个用户的档案矩阵,并基于来自用户矩阵的信息填充一个矩阵中的缺失值。
协同过滤技术是目前先进技术之一,它已经成为多个行业推荐系统的主流。例如Netflix的推荐系统中就是用了这一技术,因为电影除了类别以外,没有明确的属性。
协同过滤也可以用于类似旅游行业这种没有足够的外显特征的服务中,例如餐厅、景点、名胜古迹、旅游主题等。
混合技术。您可以用几种方法的组合来进行个性化定制。例如,您可以使用评分技术提出基本建议,或者仅使用评分技术来进行初始细分。此外,如果你有多种不同属性的可用产品,则可以同时使用协同过滤和基于内容的过滤。
并非数据科学让个性化系统如此复杂,它同样取决于你能基于已有的数据提出何种建议。所以,我们将会列出你能做的基本和更高级的事情。
个性化的搜索引擎。这是你第一个想到、也是最直接的事情。当顾客寻找酒店或航班时,系统会根据以前的行为提出个性化的建议。
个性化的电子邮件。鉴于数据科学的基础工作已经完成,这是一个相对简单的方法。根据eMarketer.com的调查,在不同行业中,80%的个性化推荐是通过电子邮件传递的,这也可以扩展到社交媒体和短信。
重新设计广告活动。如果您按照转化可能性对用户进行细分,则排名靠前的是购买最多的用户。
旅途中的建议。如果你能获取地理位置数据,则可以向用户发送有关附近餐厅的通知,或者提供相关的航空旅行服务。
最后,反馈是您可收集到的另一类数据。虽然你可以提供符合消费者偏好的建议,甚至说服他们去购买,但你并不知道用户是否喜欢这种体验。
问题在于,游客在消费完通常不会给予反馈。那么应该怎样收集评价信息呢?
给评论相应的奖励。您的客户可能会在社交媒体或专门的旅游网站上留下反馈意见,而不是你自己的评级系统。所以,你可以推出网站内部折扣、里程数积累或内部货币激励他们写评论。这是最可靠的反馈来源,因为评论和评级将直接发送到特定的用户配置文件。
使用第三方数据。使用来自社交媒体或评论平台等第三方的数据很困难,首先,您必须用户与社交媒体账号相关联,另外还要考虑法律限制。
最后,让我们总结一下数据公司Altexsoft对旅游行业的个性化数据提出的建议。首先,要有一个简单的开头,不要一开始就想为每个人提供个性化服务,因为每个客户都没有足够多的数据。所以最好的方法是使用已有的客户信息。另外,不要依赖你唯一的数据,要实地验证。最后,要注意法律规定,注意数据隐私问题。
个性化是行业发展无法跳过的问题,它将逐渐从增值手段变成必要手段。还等什么,赶快想想你能提供怎样的个性化服务吧!
原文地址:www.altexsoft.com/blog/datascience/customer-experience-personalization-in-travel-and-hospitality-using-behavioral-analytics-and-machine-learning/