全部科目 > 数据库系统工程师 >
2016年上半年 上午试卷 综合知识
第 64 题
知识点 典型应用   聚类  
关键词 算法  
章/节 数据仓库和数据分析基础知识  
 
 
聚类典型应用不包括(64),(65)是一个典型的聚类算法。
 
  A.  商务应用中,帮助市场分析人员发现不同的客户群
 
  B.  对WEB上的文档进行分类
 
  C.  分析WEB日志数据,发现相同的用户访问模式
 
  D.  根据以往病人的特征,对新来的病人进行诊断
 
 




 
 
相关试题     常见数据分析方法 

  第65题    2016年上半年  
聚类的典型应用不包括(64),(65)是一个典型的聚类算法。

  第39题    2015年上半年  
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于( )。

  第64题    2017年上半年  
数据挖掘中分类的典型应用不包括(64)。(65)可以用于数据挖掘的分类任务。

 
知识点讲解
· 典型应用
· 聚类
 
        典型应用
        本实例假设所采用的交换机支持端口镜像功能。
        1)小规模网络环境
        此种区域网连接方法较为简单,内部网络中各机构的主机使用共享式集线器连接到交换机上,或主机直接连接到交换机上,交换机不设VLAN,交换机再通过路由器接入Internet。在这种情况下,将IDS监测主机接到交换机的广播口(监听口)即可监听到内部网络间的所有通信及内部网络到Internet的所有通信,如下图所示。
        
        小规模网络环境应用
        2)分布式监测应用示例
        网络结构相对较复杂,内部网络中各机构间使用交换机连接到主交换机上,通过主交换机连接路由器接入Internet。此时在主交换机的广播口(监听口)上无法监听到从交换机上的机器间的通信,为了全面监控网络,捕捉内部网间的恶意攻击与入侵行为,就需要为每个重要的网段部署一个入侵检测探测器,并分别将检测到的事件发送到集中管理控制台,如下图所示。
        
        多子网分布式环境应用
 
        聚类
        聚类是一种无监督学习过程。根据数据的特征,将相似的数据对象归为一类,不相似的数对象归到不同的类中,这就是聚类,每个聚类也称为簇。“物以类聚,人以群分”就是聚类的典型描述。
        聚类的典型算法有:基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法和基于统计模型的方法。基于划分的方法将单个数据对象划分为k个不相交的集合,每个集合称为一个簇。典型的算法有k-均值、k-中心点算法等。基于层次的方法将数据对象集进行层次的分解。根据其是自底向上还是自顶向下分解,可以分为凝聚的方法和分裂的方法,而前者的典型算法是AGNES,后者的典型算法是DIANA。基于密度的方法基于数据对象的邻域来进行聚类分析,因此可以识别各种形状的簇,以及一个数据对象可以属于多个不同的簇,DBSCAN、OPTICS和DENCLUE是其中的典型算法。基于网格的方法把对象空间量化为有限个单元,形成一个网格结构。所有的聚类操作在该网格上进行,STING和CLIQUE是其中的两个算法。基于统计模型的算法将数据对象集看作多个服从不同分布的数据集构成,聚类的目的是识别出这些不同的分布的数据对象,EM算法是其中的一个典型算法。



更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2023 All Rights Reserved
软考在线版权所有