Python关联规则是什么


本篇内容主要讲解“Python关联规则是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python关联规则是什么”吧!1.1 基本概念项集:item的集合,如集合{牛奶、麦片、糖}是一个3项集,可以认为是购买记录里物品的集合。频繁项集:顾名思义就是频繁出现的item项的集合。如何定义频 香港云主机繁呢?用比例来判定,关联规则中采用支持度和置信度两个概念来计算比例值支持度:共同出现的项在整体项中的比例。以购买记录为例子,购买记录100条,如果商品A和B同时出现50条购买记录(即同时购买A和B的记录有50),那边A和B这个2项集的支持度为50% 置信度:购买A后再购买B的条件概率,根据贝叶斯公式,可如下表示:提升度:为了判断产生规则的实际价值,即使用规则后商品出现的次数是否高于商品单独出现的评率,提升度和衡量购买X对购买Y的概率的提升作用。如下公式可见,如果X和Y相互独立那么提升度为1,提升度越大,说明X->Y的关联性越强1.2 关联规则Apriori算法关联规则方法的步骤如下:发现频繁项集找出关联规则Apriori算法是经典的关联规则算法。Apriori算法的目标是找到最大的K项频繁集。Apriori算法从寻找1项集开始,通过最小支持度阈值进行剪枝,依次寻找2项集,3项集直到没有更过项集为止。下面是一个案例图解:图中有4个记录,记录项有1,2,3,4,5若干首先先找出1项集对应的支持度(C1),可以看出4的支持度低于最小支持阈值,先剪掉(L1)。从1项集生成2项集,并计算支持度(C2),可以看出(1,5)(1,2)支持度低于最小支持阈值,先剪掉(L2)从2项集生成3项集,(1,2,3)(1,2,5)(2,3,5)只有(2,3,5)满足要求没有更多的项集了,就定制迭代关联规则目前在scikit-learn中并没有实现。这里介绍另一个python库mlxtend。2.1 安装2.2 简单的例子来看下数据集:数据格式处理,传入模型的数据需要满足bool值的格式计算频繁项集计算关联规则 选择出来关联规则之后,根据提升度排序后,可能最高提升度的规则是在我们常识范围内,那这个规则的价值就不高。所以我们要在产生的规则中根据业务特点进行筛选,像开篇提到(啤酒->尿布)完全不同的品类之间的关联。到此,相信大家对“Python关联规则是什么”有了更深的了解,不妨来实际操作一番吧!这里是开发云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

相关推荐: Unity中的 Shader渲染模式有几种

这篇文章主要为 香港云主机大家展示了“Unity中的 Shader渲染模式有几种”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Unity中的 Shader渲染模式有几种”这篇文章吧。Unity 中的 Shader …

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 11/12 21:37
下一篇 11/12 21:37

相关推荐