大家都在看
本站推荐+更多
在数据挖掘过程中,经常面对的问题是由于各种挖掘爲法 生成的规则过多,而无法对规则进行蹄选、飄别和别除,这是 数据挖掘模型评估的关键问题。近年来,统计方法在模型评价 方面取得了很多进展。越于统计检验的49er的搜索算法是对这 类模型进行评价的有效方法,这一算法被用来从杂乱无章的数 据中发现混沛关系模式。一个非线性系统可以产生许多的关系 模式,但并不是每个模式都是有意义的,人们从统计逻辑推理 中提出一种解决从复杂关系模式中副除混纯随机关系的49er搜 索算法。该算法可以对搜索过程的每个假设模式用统计量度10: 其充分性和预测能力,如果统计量过大则归为虚模式予以抛弃。 49er搜索算法较传统的神经网络方法具有较强的二维模式识别 能力。
49ei.搜索爲法主要用于从关系数据库中的知识发现问题, 并采用REGULARITIES来描述所发现的知识。它所用的REGU- LARITIE为如下形式:
模式(PATTERN) in 范围(RANGE), 其中,RANGE为数据库(DB)中所有可能事件空间的一 个子集。模式既可以用谓词来描述,又可以用频率表(Contin- gency Table).公式和逻辑等效等来描述。49er搜索剪法的基本 搜索策略为先在所有数据粜合上搜索REGULARITIES,然后将数 据划分为不同的子猫,并在子梁上进一步搜索REGULARITIES。 在每一数据子狼内,49er搜索法对用户所认可的屈性对组合 进行2-D REGULARITIES的检测。49er搜索剪法把充分性(Sig- nificance)和强度(Strength)的统计检验方法应用于所有假设。
本站推荐
相关资讯