首页 > 知识点讲解
       频繁模式和关联规则挖掘
知识路径: > 计算机系统基础知识 > 计算机软件知识 > 数据结构与算法知识 > 算法设计与分析 > 数据挖掘算法 > 
相关知识点:4个      
        挖掘海量数据中的频繁模式和关联规则可以有效地指导企业发现交叉销售机会、进行决策分析和商务管理等。一个典型的应用是购物篮分析,即顾客经常购买的商品集合,从而分析顾客的购买习惯。而其中,沃尔玛公司对其顾客购买数据进行分析时,发现购买尿布的客户通常也会购买啤酒,根据这一规律,他们在摆放货架时,有意地把啤酒和尿布放到一起,以便顾客购买。这就是有名的啤酒尿布故事。频繁模式时频繁出现在数据集中的模式,要求满足最小支持度阈值,如啤酒和尿布频繁地出现在同一购物篮中。关联规则是形如A→B的规则,其中A和B表示数据集中的子集,要求AB既要满足最小支持度阈值,还要满足最小置信度阈值。如同时购买啤酒和尿布的购物篮满足最小支持度阈值,同时A→B满足最小置信度阈值。支持度和置信度的定义如下:
        Support(A→B)=P(A U B)
        Confidence(A→B)=P(BIA)
        求解关联规则首先要求出数据集中的频繁模式,然后由频繁模式产生关联规则。
        人们提出了多种关联规则挖掘算法:类Apriori算法;基于频繁模式增长的方法,如FP-growth;使用垂直数据格式的算法,如ECLAT。
 
 相关知识点:
 
软考在线指南
优惠劵及余额
在线支付
修改密码
下载及使用
购买流程
取消订单
联系我们
关于我们
联系我们
商务合作
旗下网站群
高级资格科目
信息系统项目管理师 系统分析师
系统架构设计师 网络规划设计师
系统规划与管理师
初级资格科目
程序员 网络管理员
信息处理技术员 信息系统运行管理员
中级资格科目
系统集成项目管理工程师 网络工程师
软件设计师 信息系统监理师
信息系统管理工程师 数据库系统工程师
多媒体应用设计师 软件评测师
嵌入式系统设计师 电子商务设计师
信息安全工程师
 

本网站所有产品设计(包括造型,颜色,图案,观感,文字,产品,内容),功能及其展示形式,均已受版权或产权保护。
任何公司及个人不得以任何方式复制部分或全部,违者将依法追究责任,特此声明。
本站部分内容来自互联网或由会员上传,版权归原作者所有。如有问题,请及时联系我们。


工作时间:9:00-20:00

客服

点击这里给我发消息 点击这里给我发消息 点击这里给我发消息

商务合作

点击这里给我发消息

客服邮箱service@rkpass.cn


京B2-20210865 | 京ICP备2020040059号-5 |京公网安备 11010502032051号 | 营业执照 | Copyright ©2000-2023 All Rights Reserved 软考在线版权所有