全部科目 > 系统集成项目管理工程师 >
2019年上半年 上午试卷 综合知识
第 17 题
知识点 数据仓库   数据仓库技术   数据库  
关键词 数据仓库   数据库   数据  
章/节 基本信息系统集成技术  
 
 
关于数据库数据仓库技术的描述,不正确的是( )。
 
  A.  数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策
 
  B.  企业数据仓库的建设是以现有企业业务系统和大量业务数据的积累为基础的,数据仓库一般不支持异构数据的集成
 
  C.  大数据分析相比传统的数据仓库应用,其数据量更大,查询分析复杂, 且在技术上须依托于分布式、云存储、虚拟化等技术
 
  D.  数据仓库的结构通常包含数据源、数据集市、数据分析服务器和前端工具4个层次
 
 




 
 
相关试题     数据库与数据仓库 

  第7题    2014年上半年  
商业智能是指利用数据挖掘、知识发现等技术分析和挖掘结构化的、面向特定领域的存储与数据仓库的信息。它可以帮助用户认清发展趋势、获取决策支持并得出结论。()不属于商业智能范畴。

  第7题    2020年下半年  
( )是从特定形式的数据中,集中提炼知识的过程。

  第13题    2015年下半年  
DBMS用于建立,使用和维护数据库(13)不是其选型的首要原则。

 
知识点讲解
· 数据仓库
· 数据仓库技术
· 数据库
 
        数据仓库
               定义
               数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
               特点:
               .数据仓库用于决策支持,面向分析型数据处理,不同于操作型数据库。
               .数据仓库是对多个异构数据源(包括历史数据)的有效集成,集成后按主题重组,且存放在数据仓库中的数据一般不再修改。
               和操作型数据库的区别
               数据仓库与操作型数据库相比,有如下区别:
               .面向主题:操作型数据库的数据面向事务处理,各个业务系统之间各自分离;而数据仓库中的数据按主题进行组织。主题是指用户使用数据仓库进行决策时所关心的某些方面,一个主题通常与多个操作型系统相关。
               .集成:操作型数据库通常与某些特定应用相关,数据库之间相互独立,且往往是异构的;而数据仓库的数据是在原有分散数据库数据抽取清理的基础上经过系统加工、汇总和整理得到的,消除了源数据中的不一致性,保证了信息是整个企业一致性的全局信息。
               .相对稳定:操作型数据库中的数据通常是实时更新的,数据根据需要及时发生变化;而数据仓库的数据主要供企业决策分析之用,涉及的数据操作主要是查询,只有少量的修改和删除,通常只需定期加载、刷新。
               .反映历史变化:操作型数据库主要关心当前某个时间段内的数据;而数据仓库通常包含历史信息,通过这些信息可以对企业的发展历程和未来趋势做出定量分析和预测。
               数据仓库系统的结构
               数据仓库系统的结构通常包含四个层次,分别为:
               .数据源:是数据仓库系统的基础,通常包括企业内部信息和外部信息。内部信息包括存放于数据库中的各种业务处理数据和各类文档数据;外部信息包括各类法律法规、市场信息和竞争对手的信息等。
               .数据存储与管理:是整个数据仓库系统的核心。数据仓库的组织管理方式决定了对外部数据的表现形式。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)两种。
               .OLAP服务器:对分析需要的数据进行有效集成,按多维模型组织,以便进行多角度、多层次的分析,并发现趋势。具体实现可以分为ROLAP、MOLAP和HOLAP。ROLAP的基本数据和聚合数据均存放在关系数据库中;MOLAP的基本数据和聚合数据均存放在多维数据库中;HOLAP的基本数据存放在关系数据库中,聚合数据存放在多维数据库中。
               .前端工具和应用:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。
 
        数据仓库技术
        数据仓库是一种只读的、用于分析的数据库,常常作为决策支持系统的底层。它从大量的事务型数据库中抽取数据,并将其清理、转换为新的存储格式,即为了决策目标而把数据聚合在一种特殊的格式中。数据仓库之父W. H. Inmon对数据仓库的定义是:数据仓库是支持管理决策过程的、面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合。其中,“主题”是指用户使用数据仓库辅助决策时所关心的重点问题,每一个主题对应一个客观分析领域,如销售、成本、利润的情况等。那么,所谓“面向主题”就是指数据仓库中的信息是按主题组织的,按主题来提供信息。“集成的”是指数据仓库中的数据不是业务处理系统数据的简单拼凑与汇总,而是经过系统地加工整理,是相互一致的、具有代表性的数据。所谓“随时间变化”,是指数据仓库中存储的是一个时间段的数据,而不仅仅是某一个时点的数据,所以主要用于进行时间趋势分析。一般数据仓库内的数据时限为5~10年,数据量也比较大。“信息本身相对稳定”,是指数据一旦进入数据仓库,一般情况下将被长期保留,变更很少。
        数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源,为了决策需要而产生的,它并不是所谓的“大型数据库”。数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。为了更好地为前端应用服务,数据仓库往往有如下几个特点:
        (1)数据效率足够高。数据仓库的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。由于有的企业每日的数据量很大,设计不好的数据仓库经常会出问题,延迟1~3日才能给出数据,显然不行的。
        (2)数据质量足够好。数据仓库所提供的各种信息,肯定要准确的数据,但由于数据仓库流程通常分为多个步骤,包括数据清洗、装载、查询、展现等,复杂的架构会更多层次,那么由于数据源有脏数据或者代码不严谨,都可以导致数据失真,客户看到错误的信息就可能导致分析出错误的决策,造成损失,而不是效益。
        (3)数据有足够的扩展性。之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来若干年的扩展性,这样的话,未来不用太快花钱去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。
        数据仓库组织和管理数据的方法与普通数据库不同。主要表现在三个方面:
        (1)依据决策要求,只从数据库中抽取那些需要的数据,并进行预处理使系统获得特定的数据格式。
        (2)数据仓库是多维的,即数据仓库的数据的组织方式有多层的行和列。
        (3)支持决策处理,不同于普通的事务处理。
        数据仓库技术在近几年蓬勃发展起来,不少厂商都推出了他们的数据仓库产品,同时也推出了一些分析工具。仅仅拥有数据仓库是不够的,在其上应用各种工具进行分析,才能使数据仓库真正发挥作用。联机分析处理和数据挖掘就是这样的分析工具。
 
        数据库
        数据库(DataBase,DB)是指长期存储在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
        系统使用的所有数据存储在一个或几个数据库中。



更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2023 All Rights Reserved
软考在线版权所有