大家都在看
本站推荐+更多
整个过程可以分为两个步 骤,一是连接,即一种类矩阵运算;二是剪枝,crm即去掉没有必 要的中间结果。具体计剪步骤如下:
第一,制定通小支持度及最小置信度。 第二,当候选集的支持度小于或等于最小支持度,即为频 繁项集(Large Itemset)
第三,首先有数据库读人所有的交易,得出候选1-项集合 C,的支持度,再找出频繁1-项集合产生候选2-项集合(::。 第四,扫描数据库,得出候选2-项集合C2的支持度,找出 频繁2-项集合i:,产生候选3-项集合C;。
第五,重复扫描数据库,与设小支持度比较,产生更高层 次的频繁项集合,再结合产生下一级候选项柴,直到不再结合 产生新的候选项细为止。5.3.3.2连接与剪枝 连接和前枝是兑法中不断If[复的两个步骤。 第一,连接。为找到通过/与自己连接产生候选A- 项目柴的棠合。该候选项的柒合记做C,。设和中的项 集,记号[;]表示/,的第y项。执行连接其中 的元索和是可以连接的,如東:
a[i]=/Ji])n(U2]=/j2])rv”(/,[>-2]=/jH]) n (/,[A:-i] =
连接产生的结東项築是:
。[1凡[2]”./_[>‘1]“[>-1]
第二,剪枝。Ct的成员可以是也可以不是频繁的,但所有 的频繁fe-项目棠都包含在C,中。扫描数据库,确定中每个候 选集计数(设置一个标志为Flag,从而确定L,)。 5.3.3.3算法分析
输入:交易数据库T;最小支持度minsup。 输出:7″中的频繁项目集L。
本站推荐
相关资讯