首页 / 科技百科 / 正文

Apriori算法通俗讲解

一. Apriori 算法简介。Apriori算法用于解决大规模数据集的关联分析问题。关联分析(association analysis)或关联规则学习(association rule learning)是从大规模数据集中寻找物品间的隐含关系。但是,寻找物品的不同组合是一项十分耗时的任务,计算代价高,蛮力搜索并不能解决问题,所以需要更智能的方法在合理时间范围内找到频繁项集。Apriori算法就是解决这个问题的。

二. 关联分析。关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:

三. Apriori 原理。无论频繁项集还是关联规则都需要计算支持度。如果数据量小,计算一个项集的支持度可以针对每个项集扫描所有数据,然后统计该项集出现的总数除以总的交易记录数,就可以得到支持度。但是对于N个物品的数据集共有2N-1中项集组合,即使4个物品也需要遍历数据集15次,100种物品有 中可能的项集组合,对现代计算机而言,需要很长的时间才能完成运算,何况事实上,商店都会有上百上千种商品。

四. Apriori 算法发现频繁项集。Apriori算法流程:

如有侵权请及时联系我们处理,转载请注明出处来自