关联规则学习

✍ dations ◷ 2025-12-07 04:03:43 #数据挖掘

关联规则学习（英语：Association rule learning）是一种在大型数据库中发现变量之间的有趣性关系的方法。它的目的是利用一些有趣性的量度来识别数据库中发现的强规则。基于强规则的概念，Rakesh Agrawal等人引入了关联规则以发现由超市的POS系统记录的大批交易数据中产品之间的规律性。例如，从销售数据中发现的规则 {洋葱, 土豆}→{汉堡} 会表明如果顾客一起买洋葱和土豆，他们也有可能买汉堡的肉。此类信息可以作为做出促销定价或产品植入等营销活动决定的根据。除了上面购物篮分析（英语：market basket analysis）中的例子以外，关联规则如今还被用在许多应用领域中，包括网络用法挖掘（英语：Web usage mining）、入侵检测、连续生产（英语：Continuous production）及生物信息学中。与序列挖掘（英语：sequence mining）相比，关联规则学习通常不考虑在事务中、或事务间的项目的顺序。

根据韩家炜等，关联规则定义为：

假设 $I=\{I_{1},I_{2},\ldots ,I_{m}\}$ $I=\{I_{1},I_{2},\ldots ,I_{m}\}$ 是项的集合。给定一个交易数据库 $D=\{t_{1},t_{2},\ldots ,t_{n}\}$ $D=\{t_{1},t_{2},\ldots ,t_{n}\}$ ，其中每个事务（Transaction）t是I的非空子集，即 $t\subseteq I$ $t\subseteq I$ ，每一个交易都与一个唯一的标识符TID（Transaction ID）对应。关联规则是形如 $X\Rightarrow Y$ $X\Rightarrow Y$ 的蕴涵式，其中 $X,Y\subseteq I$ $X,Y\subseteq I$ 且 $X\cap Y=\emptyset$ $X\cap Y=\emptyset$ ， $X {\displaystyle X}$ $X$ 和 $Y {\displaystyle Y}$ $Y$ 分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。关联规则 $X\Rightarrow Y$ $X\Rightarrow Y$ 在D中的支持度（support）是D中事务包含 $X\cup Y$ $X\cup Y$ 的百分比，即概率 $P(X\cup Y)$ $P(X\cup Y)$ ；置信度（confidence）是包含X的事务中同时包含Y的百分比，即条件概率 $P\left(Y|X\right)$ $P\left(Y|X\right)$ 。如果同时满足最小支持度阈值和最小置信度阈值，则认为关联规则是有趣的。这些阈值由用户或者专家设定。

用一个简单的例子说明。表1是顾客购买记录的数据库D，包含6个事务。项集I={网球拍,网球,运动鞋,羽毛球}。考虑关联规则：网球拍 $\Rightarrow$ $\Rightarrow$ 网球，事务1,2,3,4,6包含网球拍，事务1,2,6同时包含网球拍和网球，支持度 $support={\frac {3}{6}}=0.5$ $support={\frac {3}{6}}=0.5$ ，置信度 $confident={\frac {3}{5}}=0.6$ $confident={\frac {3}{5}}=0.6$ 。若给定最小支持度 $\alpha =0.5$ $\alpha =0.5$ ，最小置信度 $\beta =0.6$ $\beta =0.6$ ，关联规则网球拍 $\Rightarrow$ $\Rightarrow$ 网球是有趣的，认为购买网球拍和购买网球之间存在强关联。

关联规则有以下常见分类：

根据关联规则所处理的值的类型

根据关联规则所涉及的数据维数

根据关联规则所涉及的抽象层次

Apriori算法所使用的前置统计量包括：

相关

内耳内耳（英语：Inner ear）是耳的解剖结构的一部分。内耳处于颞骨空腔中，其最主要的结构是骨迷路，由前庭系统和耳蜗构成。前庭系统是平衡觉的末梢器官，负责对头部的线性加速度和角加速
威廉·詹姆士威廉·詹姆斯（英语：William James，1842年1月11日－1910年8月26日），美国哲学家、心理学家。他的弟弟亨利·詹姆斯是著名作家。他和查尔斯·桑德斯·皮尔士一起建立了实用主义。威廉
慈惠医护管理专科学校慈惠医护管理专科学校（Tzu Hui Institute of Technology）是一所位于台湾屏东县南州乡的专科学校，为台湾最南端之大专校院，目前有9个学科及通识教育中心，毕业后，授予副学士学位。该
砷元素3d104s24p32, 8, 18, 5蒸气压第一：947.0 kJ·mol−1 第二：1798 kJ·mol−1 第三：2735 kJ·mol−1 （主条目：砷的同位素砷（Arsenic），化学元素符号为As，原子序数为33。砷分布在多种
主神教主神教是另一邪教组织“被立王”派生的一个教派，系基督教新教地方教会运动变种组织。1998年被中华人民共和国政府宣布为邪教组织加以取缔。“主神教”教主刘家国，于1964年10月
Dota 2《DOTA》（中文名称：DOTA 2）是一款由Valve开发免费的多人在线战斗竞技类游戏。2011年Dota 2开始在Windows平台上进行测试，它的前身是魔兽争霸III及扩展版本冰封王座中的一张自定
救护人员紧急医疗技术员（英语：Emergency Medical Technician，缩写作 EMT）或称救护技术员（Ambulance Technician），通称救护员、急救员，通常是指提供紧急医疗服务的专业人员，惟在一些国家，亦会被
大嶝岛大嶝岛是位于中华人民共和国福建省厦门市翔安区东南部的海岛，面积约13平方公里。行政上现属厦门市翔安区大嶝街道。大嶝岛与小嶝岛、角屿组成嶝岛群岛。该群岛原为金门县大嶝
格氏貂格氏貂（Martes gwatkinsii）是唯一生活在南印度的貂。它们分布在尼尔吉里丘陵及西高止山脉。格氏貂与黄喉貂相似，但体型较大，其前额亦明显凹陷。它们背部深色，喉咙呈黄色至橙色。
鼬属见内文。鼬属（学名 Mustela），是哺乳纲食肉目鼬科的一属，共有17个种：美洲水鼬（Neovison vison）和已绝种的海鼬（Neovison macrodon）在1999年已从鼬属归类到美洲水鼬属（Neovison）。