漫画：什么是Bitmap算法？ - 专知

会员服务 ·

1

漫画：什么是Bitmap算法？

2017 年 8 月 19 日 程序猿 玻璃猫

来自：梦见（微信号：dreamsee321）

两个月之前——

为满足用户标签的统计需求，小灰利用Mysql设计了如下的表结构，每一个维度的标签都对应着Mysql表的一列：

要想统计所有90后的程序员该怎么做呢？

用一条求交集的SQL语句即可：

Select count（distinct Name） as 用户数 from table whare age = '90后' and Occupation = '程序员' ;

要想统计所有使用苹果手机或者00后的用户总合该怎么做？

用一条求并集的SQL语句即可：

Select count（distinct Name） as 用户数 from table whare Phone = '苹果' or age = '00后' ;

两个月之后——

———————————————

1. 给定长度是10的bitmap，每一个bit位分别对应着从0到9的10个整型数。此时bitmap的所有位都是0。

2. 把整型数4存入bitmap，对应存储的位置就是下标为4的位置，将此bit置为1。

3. 把整型数2存入bitmap，对应存储的位置就是下标为2的位置，将此bit置为1。

4. 把整型数1存入bitmap，对应存储的位置就是下标为1的位置，将此bit置为1。

5. 把整型数3存入bitmap，对应存储的位置就是下标为3的位置，将此bit置为1。

要问此时bitmap里存储了哪些元素？显然是4,3,2,1，一目了然。

Bitmap不仅方便查询，还可以去除掉重复的整型数。

1. 建立用户名和用户ID的映射：

2. 让每一个标签存储包含此标签的所有用户ID，每一个标签都是一个独立的Bitmap。

3. 这样，实现用户的去重和查询统计，就变得一目了然：

1. 如何查找使用苹果手机的程序员用户？

2. 如何查找所有男性或者00后的用户？

几点说明：

1. 本文的灵感来源于京东金融数据部张洪雨同学的项目经历，感谢这位大神的技术分享。

2. 该项目最初的技术选型并非Mysql，而是内存数据库hana。本文为了便于理解，把最初的存储方案写成了Mysq数据库。

—————END—————

系列文章：

《漫画：什么是一致性哈希？》

《漫画：什么是B+树？》

《漫画：什么是B-树？》

《漫画：什么是跳跃表？》

《漫画：什么是动态规划？》

《漫画：当程序猿遇上智力测试题》

《漫画：判断 2 的乘方》

《漫画算法：最小栈的实现》

《漫画：什么是大数据？》

《漫画算法：无序数组排序后的最大相邻差值》

●本文编号2560，以后想阅读这篇文章直接输入2560即可

●输入m获取文章目录

推荐↓↓↓

算法与数据结构

登录查看更多

3

相关内容

Mysql

一个开源的关系型数据库，开发者为瑞典 MySQL AB 公司。在2008年1月16号被 Sun 公司收购。而2009年，SUN 又被 Oracle 收购.目前 MySQL 被很多互联网企业所使用。有体积小、速度快、总体拥有成本低，开放源码等优点

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

147+阅读 · 2020年7月3日

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

专知会员服务

93+阅读 · 2020年6月1日

《周志华机器学习详细公式推导版》完整PDF首发！1.1w+标星开源项目pumpkin-book

《周志华机器学习详细公式推导版》完整PDF首发！1.1w+标星开源项目pumpkin-book

专知会员服务

286+阅读 · 2020年5月27日

斯坦福2020硬课《分布式算法与优化》

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

【新书】Pro 机器学习算法Python实现，379页pdf

【新书】Pro 机器学习算法Python实现，379页pdf

专知会员服务

204+阅读 · 2020年2月11日

旷视科技算法研究员面经（21个问答）

旷视科技算法研究员面经（21个问答）

算法与数据结构

37+阅读 · 2019年5月8日

各平台的推荐算法，太贴切了！

各平台的推荐算法，太贴切了！

算法与数据结构

4+阅读 · 2018年1月23日

漫画：什么是人工智能？

漫画：什么是人工智能？

大数据技术

4+阅读 · 2018年1月19日

各厂推荐算法！

各厂推荐算法！

程序猿

17+阅读 · 2018年1月13日

详解个性化推荐五大最常用算法

详解个性化推荐五大最常用算法

量子位

4+阅读 · 2017年7月8日

A Fast Content-Based Image Retrieval Method Using Deep Visual Features

Arxiv

3+阅读 · 2019年8月5日

InverseRenderNet: Learning single image inverse rendering

InverseRenderNet: Learning single image inverse rendering

Arxiv

3+阅读 · 2018年11月29日

Automatic Face Aging in Videos via Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年11月27日

Multimodal Sentiment Analysis To Explore the Structure of Emotions

Arxiv

19+阅读 · 2018年5月25日

A Projected Gradient Descent Method for CRF Inference allowing End-To-End Training of Arbitrary Pairwise Potentials

Arxiv

3+阅读 · 2018年1月2日

VIP会员

相关主题

苹果公司 (Apple Inc.)

相关VIP内容

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

147+阅读 · 2020年7月3日

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

专知会员服务

93+阅读 · 2020年6月1日

《周志华机器学习详细公式推导版》完整PDF首发！1.1w+标星开源项目pumpkin-book

《周志华机器学习详细公式推导版》完整PDF首发！1.1w+标星开源项目pumpkin-book

专知会员服务

286+阅读 · 2020年5月27日

斯坦福2020硬课《分布式算法与优化》

斯坦福2020硬课《分布式算法与优化》

专知会员服务

123+阅读 · 2020年5月6日

【新书】Pro 机器学习算法Python实现，379页pdf

【新书】Pro 机器学习算法Python实现，379页pdf

专知会员服务

204+阅读 · 2020年2月11日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

旷视科技算法研究员面经（21个问答）

旷视科技算法研究员面经（21个问答）

算法与数据结构

37+阅读 · 2019年5月8日

各平台的推荐算法，太贴切了！

各平台的推荐算法，太贴切了！

算法与数据结构

4+阅读 · 2018年1月23日

漫画：什么是人工智能？

漫画：什么是人工智能？

大数据技术

4+阅读 · 2018年1月19日

各厂推荐算法！

各厂推荐算法！

程序猿

17+阅读 · 2018年1月13日

详解个性化推荐五大最常用算法

详解个性化推荐五大最常用算法

量子位

4+阅读 · 2017年7月8日

相关论文

A Fast Content-Based Image Retrieval Method Using Deep Visual Features

Arxiv

3+阅读 · 2019年8月5日

InverseRenderNet: Learning single image inverse rendering

InverseRenderNet: Learning single image inverse rendering

Arxiv

3+阅读 · 2018年11月29日

Automatic Face Aging in Videos via Deep Reinforcement Learning

Arxiv

4+阅读 · 2018年11月27日

Multimodal Sentiment Analysis To Explore the Structure of Emotions

Arxiv

19+阅读 · 2018年5月25日

A Projected Gradient Descent Method for CRF Inference allowing End-To-End Training of Arbitrary Pairwise Potentials

Arxiv

3+阅读 · 2018年1月2日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员