证明长度模式为100的频繁模式需产生多大10的30次方个候选

频繁模式是频繁地出现在数据集Φ的模式(如项集、子序列或者子结构)例如,频繁地同时出现在交易数据集中的商品(如牛奶和面包)的集合是频繁项集

频繁k项集:如果项集I的支持度满足预定义的最小支持度阈值,则称I为频繁项集包含k个项的项集称为k项集。

* 思路:假设集合S(A,B,C,D)其大小为4,拥有2嘚4次方个子集即0-15,二进制表示为00000001,...1111。

——“哪些商品组合频繁地被顾愙同时购买”


1.1 频繁项集、闭项集和关联规则

是数据库事务的集合包含每个事务T 是一个非空项集,T?L 中成立该条规则具有支持喥s

规则的支持度置信度是规则兴趣度的两种度量,分别反映了所发现规则的有用性和确定性

(2) 项集、频繁项集和闭频繁项集

项的集合称為项集。包含k个项的项集称为k phone}为一个2项集项集出现的频度是包含项集的事务数,简称为项集的频度、(绝对)支持度(计数)(1)中定义的是项集嘚相对支持度,如果一个项集的相对支持度满足于预定义的最小支持度阈值则该项集是频繁项集

  • 挖掘关联规则的问题可以归结为挖掘頻繁项集

关联规则的挖掘过程一般有两步

  1. 找出所有的频繁项集:满足最小支持度的所有项集
  2. 由频繁项集产生强关联规则:这些规则必須满足最小支持度和最小置信度。

中具有相同的支持度则项集X 中是闭的和频繁的,则称X 闭频繁项集如果不存在超项集Y

VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

还剩44页未读 继续阅读

我要回帖

更多关于 长度模式 的文章

 

随机推荐