福利丨晚来天欲雪,一起囤大数据好书吗?

2017 年 12 月 13 日 DBAplus社群 书虫小编


每到冬天

小编便觉得自己化身仓鼠,总爱囤囤囤

囤点衣服愉悦自己的心情

囤点秋膘抵抗寒冷的严冬

当然,还要囤点好书丰富自己的精神世界…


可书那么多,如何沙中淘金?

今天,小编携手图灵教育

先给大家带来3本绝赞的大数据译著推荐

同时按照惯例,送出3个赠书名额


近期也将陆续推出更多书单

若有任何建议和需求

欢迎评论区留言告诉我们



本期书单


《Python数据科学入门》

作者:Dmitry Zinoviev

译者:熊子源


编辑推荐:本书以Python语言讲述数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python核心特性,文本数据、数据库、表格形式的数值数据、series和frame、网络数据的使用,数据的绘制,概率与统计,机器学习。


购书链接:https://item.jd.com/12234539.html


《Spark快速大数据分析》

作者:Holden Karau , Andy Konwinski 

Patrick Wendell , Matei Zaharia

译者:王道远


编辑推荐:如今,所有领域的数据量都在急剧增长。如何才能高效利用这些数据呢?本书介绍了开源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。


本书由 Spark 开发者及核心成员共同打造,豆瓣评分8.0。讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。


购书链接:https://item.jd.com/11782888.html


《Spark高级数据分析》

作者:Sandy Ryza , Uri Laserson

Sean Owen , Josh Wills

译者:龚少成


编辑推荐:这是一本实用手册,四位作者均是Cloudera公司的数据科学家,他们联袂展示了利用Spark进行大规模数据分析的若干模式,而且每个模式都自成一体。他们将Spark、统计学方法和真实数据集结合起来,通过实例向读者讲述了怎样解决分析型问题。


本书首先介绍了Spark及其生态系统,豆瓣评分7.3。接着详细介绍了将分类、协同过滤及异常检查等常用技术应用于基因学、安全和金融领域的若干模式。如果你对机器学习和统计学有基本的了解,并且会用Java、Python或Scala编程,这些模式将有助于你开发自己的数据应用。


购书链接:https://item.jd.com/11802667.html


拿书姿势


> > > >

姿势一:精选留言集赞


在本文微信留言区(dbaplus)写下你对大数据领域技术发展的思考与看法,抑或是你希望下一期小编推荐哪些主题的书籍,截止至周一(12月18日)中午12点,精选留言集赞数Top1可获得获得本期推荐的任意好书一本。


> > > >

姿势二:最具价值留言奖


除了精选集赞数Top1的留言以外,我们还将从精选留言中选出2位评论最精彩的幸运读者获得赠书请记住,留言内容越精彩越容易获得小编青睐哦~


> > > >

姿势三:本月已获赠书者不可重复拿书


同一个月份里,已获赠者将不可重复拿书,本条规则旨在惠及更多还没拿过书的同学们,也让好书能够被更多喜爱它的人所读。


更多好文推荐


唯品会海量实时OLAP分析技术升级之路

携程机票ElasticSearch集群运维驯服记

携程机票大数据架构最佳实践

基于Kafka+Storm构建流式计算卖家日志系统

这是一篇最通俗易懂的Hadoop HDFS实践攻略!

7个实例全面掌握Hadoop MapReduce

一篇文带你快速起步Apache Storm

基于Storm构建分布式实时处理应用初探

如何根据数据冷热程度分层存储,让HDFS更高效?

从ITOA运维和大数据分析着眼,构建智能化日志分析平台

分布式实时数据处理实战:从选型、应用到优化

一篇文全面解读Kafka Consumer设计精要

深入解析Kafka高可用设计如何步步为营

超实用的Spark数据倾斜解决姿势,学起来!


登录查看更多
4

相关内容

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
141+阅读 · 2020年5月19日
【经典书】贝叶斯编程,378页pdf,Bayesian Programming
专知会员服务
247+阅读 · 2020年5月18日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
专知会员服务
123+阅读 · 2020年3月26日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
192+阅读 · 2020年3月12日
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
339+阅读 · 2020年1月27日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
福利 | 这是一个理论+实战的机器学习加油包
DBAplus社群
7+阅读 · 2018年6月28日
福利 | 当Python遇上大数据与机器学习,入门so easy!
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
一位数据分析师的书单
R语言中文社区
12+阅读 · 2017年10月28日
福利一丨20本技术好书相送,请查收
InfoQ
7+阅读 · 2017年10月24日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Arxiv
10+阅读 · 2020年4月5日
Arxiv
38+阅读 · 2020年3月10日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
Simplifying Graph Convolutional Networks
Arxiv
12+阅读 · 2019年2月19日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
7+阅读 · 2018年1月10日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【实用书】Python数据科学从零开始,330页pdf
专知会员服务
141+阅读 · 2020年5月19日
【经典书】贝叶斯编程,378页pdf,Bayesian Programming
专知会员服务
247+阅读 · 2020年5月18日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
117+阅读 · 2020年5月10日
专知会员服务
123+阅读 · 2020年3月26日
【经典书】Python数据数据分析第二版,541页pdf
专知会员服务
192+阅读 · 2020年3月12日
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
339+阅读 · 2020年1月27日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
相关资讯
福利 | 这是一个理论+实战的机器学习加油包
DBAplus社群
7+阅读 · 2018年6月28日
福利 | 当Python遇上大数据与机器学习,入门so easy!
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
一位数据分析师的书单
R语言中文社区
12+阅读 · 2017年10月28日
福利一丨20本技术好书相送,请查收
InfoQ
7+阅读 · 2017年10月24日
【大数据】数据挖掘与数据分析知识流程梳理
产业智能官
12+阅读 · 2017年9月22日
相关论文
Generating Fact Checking Explanations
Arxiv
9+阅读 · 2020年4月13日
Arxiv
10+阅读 · 2020年4月5日
Arxiv
38+阅读 · 2020年3月10日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
Simplifying Graph Convolutional Networks
Arxiv
12+阅读 · 2019年2月19日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
7+阅读 · 2018年1月10日
Top
微信扫码咨询专知VIP会员