漫画:什么是Bitmap算法?

2017 年 8 月 6 日 算法与数据结构 玻璃猫

来自:梦见(微信号:dreamsee321)










两个月之前——













为满足用户标签的统计需求,小灰利用Mysql设计了如下的表结构,每一个维度的标签都对应着Mysql表的一列



要想统计所有90后的程序员该怎么做呢?


用一条求交集的SQL语句即可:


Select count(distinct Name) as 用户数 from table whare age = '90后' and Occupation = '程序员' ;



要想统计所有使用苹果手机或者00后的用户总合该怎么做?


用一条求并集的SQL语句即可:


Select count(distinct Name) as 用户数 from table whare Phone = '苹果' or age = '00后' ;





两个月之后——












———————————————













1. 给定长度是10的bitmap,每一个bit位分别对应着从0到9的10个整型数。此时bitmap的所有位都是0。

   


2. 把整型数4存入bitmap,对应存储的位置就是下标为4的位置,将此bit置为1。



3. 把整型数2存入bitmap,对应存储的位置就是下标为2的位置,将此bit置为1。



4. 把整型数1存入bitmap,对应存储的位置就是下标为1的位置,将此bit置为1。



5. 把整型数3存入bitmap,对应存储的位置就是下标为3的位置,将此bit置为1。




要问此时bitmap里存储了哪些元素?显然是4,3,2,1,一目了然。


Bitmap不仅方便查询,还可以去除掉重复的整型数。















1. 建立用户名和用户ID的映射:




2. 让每一个标签存储包含此标签的所有用户ID,每一个标签都是一个独立的Bitmap。




3. 这样,实现用户的去重和查询统计,就变得一目了然:












1. 如何查找使用苹果手机的程序员用户?




2. 如何查找所有男性或者00后的用户?




















几点说明:


1. 本文的灵感来源于京东金融数据部张洪雨同学的项目经历,感谢这位大神的技术分享。


2. 该项目最初的技术选型并非Mysql,而是内存数据库hana。本文为了便于理解,把最初的存储方案写成了Mysq数据库。


—————END—————


系列文章:

漫画:什么是一致性哈希?

漫画:什么是B+树?

漫画:什么是B-树?

漫画:什么是跳跃表?

漫画:什么是动态规划?

漫画:当程序猿遇上智力测试题

漫画:判断 2 的乘方

漫画算法:最小栈的实现

漫画:什么是大数据?

漫画算法:无序数组排序后的最大相邻差值



●本文编号440,以后想阅读这篇文章直接输入440即可。

●输入m获取到文章目录

推荐↓↓↓
 

Python编程

更多推荐18个技术类公众微信

涵盖:程序人生、算法与数据结构、黑客技术与网络安全、大数据技术、前端开发、Java、Python、Web开发、安卓开发、iOS开发、C/C++、.NET、Linux、数据库、运维等。

登录查看更多
4

相关内容

一个开源的关系型数据库,开发者为瑞典 MySQL AB 公司。在2008年1月16号被 Sun 公司收购。而2009年,SUN 又被 Oracle 收购.目前 MySQL 被很多互联网企业所使用。有体积小、速度快、总体拥有成本低,开放源码等优点
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
57+阅读 · 2020年6月26日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
119+阅读 · 2020年5月6日
算法与数据结构Python,369页pdf
专知会员服务
163+阅读 · 2020年3月4日
【经典书】Python计算机视觉编程,中文版,363页pdf
专知会员服务
139+阅读 · 2020年2月16日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
200+阅读 · 2020年2月11日
【新书】Python编程基础,669页pdf
专知会员服务
194+阅读 · 2019年10月10日
17种深度强化学习算法用Pytorch实现
新智元
30+阅读 · 2019年9月16日
3 行代码 5 秒抠图的 AI 神器,根本无需 PS
大数据技术
20+阅读 · 2019年7月24日
告别 PS !3 行代码 5 秒搞定抠图的 AI 神器!
程序人生
6+阅读 · 2019年7月11日
旷视科技算法研究员面经(21个问答)
算法与数据结构
37+阅读 · 2019年5月8日
国内各大平台的推荐算法,看到360的时候笑喷了……
黑客技术与网络安全
5+阅读 · 2018年3月28日
各平台的推荐算法,太贴切了!
算法与数据结构
4+阅读 · 2018年1月23日
漫画: 什么是人工智能?
大数据技术
4+阅读 · 2018年1月19日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
详解个性化推荐五大最常用算法
量子位
4+阅读 · 2017年7月8日
Learning to Importance Sample in Primary Sample Space
Arxiv
11+阅读 · 2018年5月13日
VIP会员
相关VIP内容
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
57+阅读 · 2020年6月26日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
119+阅读 · 2020年5月6日
算法与数据结构Python,369页pdf
专知会员服务
163+阅读 · 2020年3月4日
【经典书】Python计算机视觉编程,中文版,363页pdf
专知会员服务
139+阅读 · 2020年2月16日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
200+阅读 · 2020年2月11日
【新书】Python编程基础,669页pdf
专知会员服务
194+阅读 · 2019年10月10日
相关资讯
17种深度强化学习算法用Pytorch实现
新智元
30+阅读 · 2019年9月16日
3 行代码 5 秒抠图的 AI 神器,根本无需 PS
大数据技术
20+阅读 · 2019年7月24日
告别 PS !3 行代码 5 秒搞定抠图的 AI 神器!
程序人生
6+阅读 · 2019年7月11日
旷视科技算法研究员面经(21个问答)
算法与数据结构
37+阅读 · 2019年5月8日
国内各大平台的推荐算法,看到360的时候笑喷了……
黑客技术与网络安全
5+阅读 · 2018年3月28日
各平台的推荐算法,太贴切了!
算法与数据结构
4+阅读 · 2018年1月23日
漫画: 什么是人工智能?
大数据技术
4+阅读 · 2018年1月19日
各厂推荐算法!
程序猿
17+阅读 · 2018年1月13日
详解个性化推荐五大最常用算法
量子位
4+阅读 · 2017年7月8日
Top
微信扫码咨询专知VIP会员