书单 |《移动数据挖掘》(文末有福利)

2017 年 5 月 11 日 微软研究院AI头条

今天向大家推荐由微软亚洲研究院社会计算组撰写的新书《移动数据挖掘》。该书选取当前学术界和工业界的热点为主题,自成体系,介绍了移动数据挖掘的基本概念和方法,包括移动数据预处理、用户移动模型、用户画像以及兴趣位置推荐等。作者团队包括来自电子科技大学计算机学院讲师、教育大数据研究所副所长连德富博士,微软亚洲研究院副研究员张富峥博士,中国科大-微软联合培养博士王英子,微软高级科学家袁晶博士,以及微软亚洲研究院资深研究员谢幸博士。


新书已开始预售,地址请戳文末“阅读原文”。

 

作者推荐


这本书梳理总结了作者团队过去十年在人群移动数据理解上展开的研究,包括移动数据预处理、用户移动建模、用户画像以及地点推荐等内容。这些内容很多都曾在数据挖掘领域的顶级国际会议和期刊发表,甚至获得过会议最佳论文奖。作者相信,在这个大数据时代,这些研究经验不仅对许多实际应用有着重要的价值,而且还有助于解决一些具有社会意义的科学问题。此外,细心的读者可能会发现,五位作者有至少两个共同点:第一,所有作者都在或曾经在微软亚洲研究院工作或长期实习;第二,所有作者都毕业或就读于中国科技大学。实际上这正反映了两个机构之间紧密的学术合作关系。我们期待读者能从本书中发现有用的知识,也非常欢迎和我们进行交流,共同推进这个领域的研究发展。


谢幸博士

精彩一览


移动数据及其价值(节选自作者前言)


在过去十年,随着室内外定位、移动社交网络和物联网技术的发展及普及,移动数据的种类、规模和产生速度一直在迅速增加。这些数据中很大一部分是由人产生的,也就是通过各种方式记录下来的人的活动历史。它们包含了大量的知识,对于众多实际应用有着重要的价值。我们可以通过对这些数据进行挖掘,发现人类出行规律,并针对用户的属性和兴趣爱好生成画像,从而为用户提供更加个性化的服务,包括交通出行规划、旅游路线和购物餐饮推荐等。这些知识还能用来研究疾病传播、城市发展以及人类迁徙等具有重大社会意义的科学问题。

 

 挑战与任务(节选自第一章“引言”)


移动数据的形式多种多样,有来自移动社交网络中的签到数据、与基站通信时的日志数据,还有公交交通工具的刷卡数据、美钞的交易数据,等等,它们的特点也各有不同,具体表现在采样频率、数据采集方式、定位精度等。不过针对这些数据的挖掘所面临的挑战是类似的:移动数据的可扩展性、稀疏性、群体智慧、和异质性。


在这些挑战之下,本书将以人的轨迹数据,特别是移动社交网络的位置数据为中心,结合人的基本信息及社交网络等相关信息来研究个人与群体的移动模式特性,具体包括用户移动建模、基于移动数据的用户画像及个性化兴趣地点推荐等。


 用户画像(节选自第四章“基于移动数据的用户画像”)


“用户画像”起源于交互设计之父艾伦∙库珀提出的Persona的概念:通过数据了解用户,然后根据他们的目的、行为和观点的差异,将他们分为不同的类型,再从每种类型中抽取出典型的特征,赋予名字、照片、一些人口统计学要素和场景描述,这就形成了一个人物原型(Persona)。在大数据时代的进程中,最明显的变化莫过于用户的一切行为都将是“可视化”的。随着数据挖掘技术的深入研究和应用,学术界和工业界都致力于通过数据留下的痕迹深入理解用户,尤其是工业界的专注点日益聚焦于如何利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“用户画像”作为大数据的根基,完美地抽象出一个用户的信息全貌,为进一步准确、快速地分析用户的行为习惯和喜好提供了坚实的依据,奠定了大数据时代的基石。


……


消费冲动心理是消费者行为学和市场营销中经常研究的另一种非常重要的用户心理特质,其刻画的是用户在受到外界因素的影响时,往往会进行事先没有计划或无意识的购买行为。其实消费冲动心理在人类生活中扮演了重要的角色。据统计在超市发生的购买行为中,超过70%的购物都是由于消费冲动心理所引起的。数十年来,在心理学和社会学的研究中,学者们也设计了各种各样的度量表来从不同的角度测量用户的消费冲动心理。但是度量表在消费冲动心理中存在成本高、易受实验者效应影响,以及难以被用来测量大规模人群的缺点。


在大数据时代,移动数据的普遍收集在很大程度上能够刻画用户的各种消费行为,比如在餐厅的签到数据表明了用户就餐的消费行为,在商场连接Wi-Fi的数据蕴含了用户购物的消费行为;与此同时,社交网络的快速发展也逐渐对用户的消费行为产生越来越重要的影响,一方面社交网络中朋友对某件商品的讨论或者口口相传可能会成为冲动购物的刺激因素,另一方面,越来越多的品牌店甚至个体卖家利用社交网络作为越来越重要的市场营销平台。因此,把两者关联起来,就能够通过数据驱动的方式来计算消费冲动心理,使得消费冲动心理的测量能够被大规模的采用。如图4.10所示的例子,在国家主席习近平就餐庆丰包子铺的事件后,社交网络上出现了大量的相关信息,而随后有大量的用户在该店铺留下了签到数据。签到数据和社交网络上相关信息的强关联性表明了很多用户很可能是受到社交网络上信息的刺激才去消费的。

 

最后,希望这本书能够帮助到对移动数据挖掘有兴趣的你,与我们共同推进此领域的研究与发展。


留言有礼


  • 欢迎大家在留言区留言,分享你在移动数据方面的见解,小编会挑选留言进入精选

  • 精选留言被赞最多的小伙伴即可获赠这本《移动数据挖掘》

  • 留言截止时间:2017年5月20号

我们会在活动结束后第一时间派赠

点击“阅读原文”购买新书


你也许还想看:




感谢你关注“微软研究院AI头条”,我们期待你的留言和投稿,共建交流平台。来稿请寄:msraai@microsoft.com。微软小冰进驻微软研究院微信啦!快去主页和她聊聊天吧。

登录查看更多
0

相关内容

异质信息网络分析与应用综述,软件学报-北京邮电大学
台湾大学林轩田机器学习书籍《从数据中学习》,216页pdf
【教程推荐】中科大刘淇教授-数据挖掘基础,刘 淇
专知会员服务
80+阅读 · 2020年3月4日
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
福利丨晚来天欲雪,一起囤大数据好书吗?
DBAplus社群
4+阅读 · 2017年12月13日
【机器学习】从零开始入门机器学习算法实践
产业智能官
10+阅读 · 2017年12月1日
【回顾】从零开始入门机器学习算法实践
AI研习社
5+阅读 · 2017年11月28日
一位数据分析师的书单
R语言中文社区
12+阅读 · 2017年10月28日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
干货 | KDD2017现场:中国论坛直击(讲座完整PPT)
大数据文摘
3+阅读 · 2017年8月16日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
23+阅读 · 2018年8月3日
Arxiv
4+阅读 · 2018年1月19日
VIP会员
相关资讯
手把手带你玩转机器学习和深度学习
大数据技术
8+阅读 · 2018年1月3日
福利丨晚来天欲雪,一起囤大数据好书吗?
DBAplus社群
4+阅读 · 2017年12月13日
【机器学习】从零开始入门机器学习算法实践
产业智能官
10+阅读 · 2017年12月1日
【回顾】从零开始入门机器学习算法实践
AI研习社
5+阅读 · 2017年11月28日
一位数据分析师的书单
R语言中文社区
12+阅读 · 2017年10月28日
关于数据挖掘,有几本书推荐给你......
图灵教育
16+阅读 · 2017年10月11日
干货 | KDD2017现场:中国论坛直击(讲座完整PPT)
大数据文摘
3+阅读 · 2017年8月16日
Top
微信扫码咨询专知VIP会员