一句话+一张图——说清楚Aprioir关联规则算法 - 专知

会员服务 ·

1

一句话+一张图——说清楚Aprioir关联规则算法

2018 年 6 月 26 日 数盟

一句话

关联分析（关联规则学习): 从大规模数据集中 寻找物品间的隐含关系被称作关联分析(associati analysis) 或者关联规则学习（association rule learning）

一张图

解释一下这张图：
在关联规则Aprioir算法中，有两个很重要的概念，分别是频繁项集（frequent item sets），关联规则（associational rules），它们是用来描述隐含关系的形式。

频繁项集（frequent item sets）: 经常出现在一块的物品的集合。
关联规则（associational rules）: 暗示两种物品之间可能存在很强的关系。

那么频繁的定义是什么呢？怎么样才算频繁呢？ 度量它们的方法有很多种，这里我们来简单的介绍下支持度和可信度。

支持度: 数据集中包含该项集的记录所占的比例。例如上图中，{豆奶} 的支持度为 4/5。{豆奶, 尿布} 的支持度为 3/5。
可信度: 针对一条诸如 {尿布} -> {葡萄酒} 这样具体的关联规则来定义的。这条规则的可信度被定义为支持度({尿布, 葡萄酒})/支持度({尿布})，从图中可以看出支持度({尿布, 葡萄酒}) = 3/5，支持度({尿布}) = 4/5，所以 {尿布} -> {葡萄酒} 的可信度 = 3/5 / 4/5 = 3/4 = 0.75。

举个栗子呗

还是上面的那个尿布和葡萄酒的栗子，让我们仔细的看一下它的关联规则的发现过程（Aprioir）

过程1：寻找k项频繁集

我们规定最小支持度为0.3
L1为1项频繁集，可以从图中看出它的计算过程为：

P(豆奶)=豆奶出现的次数订单总数量P(豆奶)=豆奶出现的次数订单总数量

L2为2项频繁集，从L1中选择候选者（去除了小于最小支持度的数据），计算过程为：

P(豆奶，莴苣)=豆奶，莴苣共同出现的次数订单总数量P(豆奶，莴苣)=豆奶，莴苣共同出现的次数订单总数量

同理可以推出L3

过程2：发现关联规则

这里举一个例子说明，买了尿布的人也会继续买葡萄酒的规则，支持度为0.6（前面已经算出），那么它的置信度计算过程为：

P(尿布−−>葡萄酒)=尿布，葡萄酒同时出现的概率尿布出现的概率=P(葡萄酒|尿布)P(尿布−−>葡萄酒)=尿布，葡萄酒同时出现的概率尿布出现的概率=P(葡萄酒|尿布)

以上就是Aprioir关联规则算法的整体思路啦！！！

识别下图二维码，加数盟社区“”为好友，回复暗号“入群”，加入数盟社区交流群，群内持续有干货分享~~

本周干货内容：IBM杨晓洋-认知计算和数据科学引领行业创新 v4.0

媒体合作请联系：

邮箱：xiangxiaoqing@stormorai.com

登录查看更多

7

相关内容

关联规则学习

关联规则学习

顾名思义，关联规则就是发现数据背后存在的某种规则或者联系。

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

147+阅读 · 2020年7月3日

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

专知会员服务

93+阅读 · 2020年6月1日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【贝叶斯规则因果推理】《Causal Inference with Bayes Rule》by Finn Lattimore, David Rohde

【贝叶斯规则因果推理】《Causal Inference with Bayes Rule》by Finn Lattimore, David Rohde

专知会员服务

48+阅读 · 2019年12月13日

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

专知会员服务

58+阅读 · 2019年10月20日

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

开放知识图谱

41+阅读 · 2019年7月2日

决策树

Datartisan数据工匠

4+阅读 · 2018年4月19日

基于机器学习方法的POI品类推荐算法

基于机器学习方法的POI品类推荐算法

全球人工智能

3+阅读 · 2017年11月22日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

详解个性化推荐五大最常用算法

详解个性化推荐五大最常用算法

量子位

4+阅读 · 2017年7月8日

OK-VQA: A Visual Question Answering Benchmark Requiring External Knowledge

OK-VQA: A Visual Question Answering Benchmark Requiring External Knowledge

Arxiv

10+阅读 · 2019年9月4日

Logically-Constrained Reinforcement Learning

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

Robustness Analysis of Visual QA Models by Basic Questions

Arxiv

4+阅读 · 2018年5月26日

Structuring Wikipedia Articles with Section Recommendations

Arxiv

5+阅读 · 2018年4月17日

VIP会员

相关主题

关联规则学习

相关VIP内容

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

147+阅读 · 2020年7月3日

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

【斯坦福经典书】计算机时代的统计推断: 算法、证据和数据科学，493页pdf

专知会员服务

93+阅读 · 2020年6月1日

【基于元学习的推荐系统】5篇相关论文

专知会员服务

88+阅读 · 2020年1月20日

【贝叶斯规则因果推理】《Causal Inference with Bayes Rule》by Finn Lattimore, David Rohde

【贝叶斯规则因果推理】《Causal Inference with Bayes Rule》by Finn Lattimore, David Rohde

专知会员服务

48+阅读 · 2019年12月13日

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

专知会员服务

58+阅读 · 2019年10月20日

热门VIP内容

开通专知VIP会员享更多权益服务

【MIT博士论文】弱监督学习：理论、方法与应用

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

锚定情报：合成欺骗时代的地面真相

NeurIPS 2025 | NMKE：基于神经元归因与动态稀疏掩码的终身知识编辑

相关资讯

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法

开放知识图谱

41+阅读 · 2019年7月2日

决策树

Datartisan数据工匠

4+阅读 · 2018年4月19日

基于机器学习方法的POI品类推荐算法

基于机器学习方法的POI品类推荐算法

全球人工智能

3+阅读 · 2017年11月22日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

详解个性化推荐五大最常用算法

详解个性化推荐五大最常用算法

量子位

4+阅读 · 2017年7月8日

相关论文

OK-VQA: A Visual Question Answering Benchmark Requiring External Knowledge

OK-VQA: A Visual Question Answering Benchmark Requiring External Knowledge

Arxiv

10+阅读 · 2019年9月4日

Logically-Constrained Reinforcement Learning

Logically-Constrained Reinforcement Learning

Arxiv

3+阅读 · 2018年12月6日

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

The Bottleneck Simulator: A Model-based Deep Reinforcement Learning Approach

Arxiv

11+阅读 · 2018年7月12日

Robustness Analysis of Visual QA Models by Basic Questions

Arxiv

4+阅读 · 2018年5月26日

Structuring Wikipedia Articles with Section Recommendations

Arxiv

5+阅读 · 2018年4月17日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员