大数据和云计算技术周报(第105期)

2019 年 6 月 3 日 大数据和云计算技术
导语

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。

    

本期会给大家奉献上精彩的:Kafka、Flink、MongoDB、Gossip、Hadoop、Spark、Redis、ElasticSearch、Mysql、分类树、回归树、 Serverless、池化技术。全是干货,希望大家喜欢!!!


#大数据和云计算技术社区#希望通过坚持定期分享能帮助同学在大数据学习道路上尽一份微博之力。相信长期坚持认真阅读周报的同学,在技术的道路上一定会日益精进!感谢编辑们的长期坚持!也请同学们继续打赏,支持社区,支持编辑们持续奉献高质量知识!


#大数据和云计算技术社区#长期招募有兴趣参与社区编辑和运营的同学,欢迎扫描文末二维码联系(参与社区工作,收获知识和进步,还有红包哦)。


特别提醒,文末有惊喜!


以下是正文,限于众编辑水平有限,不保证大家都喜欢。(如果链接不能点开  请用二维码  谢谢

1Gossip

本文从7个角度理解Gossip协议,Gossip协议是一个通信协议,一种传播消息的方式,也是一种最终一致性协议

https://mp.weixin.qq.com/s/vziFrW-DUhcVpHXjS4h_dw


2分类树和回归树

分类树就是面向分类的,回归树就是面向回的,本文详细分析了分类树和回归树的区别 以及各自的用途

https://mp.weixin.qq.com/s/UbC0xPJrcQR-FuWL56t3_w


3Hadoop

Uber为了可靠且一致地找到数据的位置,本文作者及其同事开发了一个名为全局索引(Global Index)的组件。这个组件负责在 Hadoop 表中簿记(bookkeeping)并查找数据位置。它提供了高吞吐量、强一致性和水平可扩展能力,并帮助用户更好地更新 Hadoop 表中数以 PB 计的数据。

https://mp.weixin.qq.com/s/mhJ2Q30APlCP6_AkV6gG3w


4Spark Sql

本文以一个简单sql查询入题,详细介绍了目前sparksql做的所有优化点,非常详细,推荐大家一看。

https://mp.weixin.qq.com/s/O3jFljoZ8Cha0BiEv_vfKA


5Spark Streaming

spark structured streaming 介绍

https://mp.weixin.qq.com/s/xtBQQFfqZKCyETzWaN4AWA


6Spark Shuffle

本文主要讲作者在网易工作将近一年来关于Spark Shuffle方面所做的三点优化。

https://mp.weixin.qq.com/s/jl-5UpmkA4XXJebpSxW8_A


7Mongodb

本文讲述了MongoDB的内存是如何分配的,以及存储引擎缓存cacheSizeGB选项的配置,TCP连接及请求处理中的缓存参数设置



 


8Mysql

Mysql百万级数据量分页查询方法和思路,并提供了具体的实施sql

https://mp.weixin.qq.com/s/sBYxbLW7PrlHR9lQpxsWjQ


9ElasticSearch

ElasticSearch 是基于 Lucene 实现的分布式搜索引擎,提供了海量数据实时检索和分析能力。滴滴从 2016 年 4 月开始组建团队,解决 ElasticSearch 在使用过程中遇到的性能问题。并且,随着业务体量的发展,滴滴构建了基于 ElasticSearch 的一站式搜索平台。


10Flink和Kafka

本文主要讲了flink sql与kafka结合的多种方式,flink与kafka整合是很常见的一种实时处理场景,尤其是kafka 0.11版本以后生产者支持了事务,使得flink与kafka整合能实现完整的端到端的仅一次处理

https://mp.weixin.qq.com/s/8-yn2ai-Jp5cOx4UftPCmw


11Redis

Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。从2010年3月15日起,Redis的开发工作由VMware主持。从2013年5月开始,Redis的开发由Pivotal赞助。

https://mp.weixin.qq.com/s/8jmPwEZ7CPg0pVd79in_Tg


12池化技术


本文是基于 U 型结构的特征网络研究池化对显著性检测的改进

https://mp.weixin.qq.com/s/urgkUcu2ZWQMGPZdArWzYg


13Serverless


Google Trends 所显示的 3 年猛增 20 倍的“ Serverless ” 搜索量,可以佐证 Serverless 在整个行业中的火爆程度

https://mp.weixin.qq.com/s/V-lKDcpj4fLSeO-u9JnbPg


14开心一刻


随机函数可以帮你实现家庭和谐: Talk(){:top word(1)="恩!"; word(2)="好的!";word(3)="然后呢?";word(4)="有道理";i=random(4); say word(i) goto top;} 

致谢:

周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞


猜你喜欢

#大数据和云计算机技术社区#博客精选(2017)

NoSQL 还是 SQL ?这一篇讲清楚

阿里的OceanBase解密

#大数据和云计算技术#: "四有"社区介绍

大数据和云计算技术周报(第56期)

新数仓系列:Hbase周边生态梳理(1)

《大数据架构详解》第2次修订说明

简单梳理跨数据中心数据库

云观察系列:漫谈运营商公有云发展史

云观察系列:百度云的一波三折

云观察系列:阿里云战略观察

超融合方案分析系列(7)思科超融合方案分析

加入技术讨论群

《大数据和云计算技术》社区群人数已经6000+,欢迎大家加下面助手微信,拉大家进群,自由交流。


喜欢QQ群的,可以扫描下面二维码:

欢迎大家通过二维码打赏支持技术社区(英雄请留名,社区感谢您,打赏次数超过108+):




登录查看更多
0

相关内容

【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
【LinkedIn报告】深度自然语言处理的搜索系统,211页pdf
专知会员服务
106+阅读 · 2019年6月21日
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
大数据流处理平台的技术选型参考
架构文摘
4+阅读 · 2018年3月14日
《大数据架构详解:从数据获取到深度学习》第⑨次重印
大数据和云计算技术
3+阅读 · 2018年3月3日
《大数据架构详解:从数据获取到深度学习》第八次重印
大数据和云计算技术
5+阅读 · 2017年12月24日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
Arxiv
15+阅读 · 2020年2月6日
Arxiv
20+阅读 · 2019年11月23日
VIP会员
相关VIP内容
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
95+阅读 · 2019年12月4日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
【LinkedIn报告】深度自然语言处理的搜索系统,211页pdf
专知会员服务
106+阅读 · 2019年6月21日
相关资讯
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
大数据流处理平台的技术选型参考
架构文摘
4+阅读 · 2018年3月14日
《大数据架构详解:从数据获取到深度学习》第⑨次重印
大数据和云计算技术
3+阅读 · 2018年3月3日
《大数据架构详解:从数据获取到深度学习》第八次重印
大数据和云计算技术
5+阅读 · 2017年12月24日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Top
微信扫码咨询专知VIP会员