软考在线  |  计算机技术与软件专业技术资格(水平)考试   |   [请选择科目]
[ 成为 VIP会员 ]        登录  |  注册      我的  购物车
0
 
科目切换  联系我们 
    
  |   [请选择科目]

VIP:有效提升20分!  真题  历年真题 (可免费开通)/  百科全书/ 机考模拟平台/  最难真题榜/  自测/  攻打黄金十二宫/  真题检索/  真题下载/  真题词库
知识   必会知识榜/  最难知识榜/  知识点查询/      文档   学习计划/  精华笔记/  试题文档     纸质图书   《百科全书》HOT!!/         /        首页/  2025年上半年专区/  手机版/ 
免费智能真题库 > 历年试卷 > 信息系统项目管理师 > 2023年下半年 信息系统项目管理师 上午试卷 综合知识 (第三批)
  第21题      
  知识点:   范围规划   范围管理   分析技术   评估   收集需求   数据分析   数据分析技术
  关键词:   产品范围   范围管理   数据分析   需求   范围   数据        章/节:   项目范围管理过程       
  错误率: 29%      难度系数:      

 
适用于规划范围管理的数据分析技术是( ),用于评估收集需求,详述项目和产品范围,创造产品,确认范围和控制范围的各种方法。
 
 
  A.  备选方案分析
 
  B.  趋势分析
 
  C.  根本原因分析
 
  D.  偏差分析
 
 
 确定 并 查看答案解析     知识点讲解  我要标记      有奖找茬      上一题        下一题 
 

 
  第22题    2024年上半年  
   93%
关于范围管理的描述,正确的是()。
  第33题    2017年上半年  
   35%
项目范围说明书(初步)的内容不包括( )。
  第34题    2008年下半年  
   69%
项目范围变更控制,包括(34) 。
   知识点讲解    
   · 范围规划    · 范围管理    · 分析技术    · 评估    · 收集需求    · 数据分析    · 数据分析技术
 
       范围规划
        输入
        1.组织过程资产
        影响项目范围管理的相关政策、流程、指南等。对范围规划有具体关系的过程资产包括:
        .与范围规划和管理相关的组织方针。
        .与范围规划和管理相关的组织程序。
        .历史项目信息,如相关的经验教训。
        2.企业环境因素
        如企业文化、架构、管理工具、人力资源、相关政策、市场状况等,所有这些都会对项目范围管理产生一定的影响。
        3.项目章程
        项目章程是制订项目章程的输出,参见第3章的3.3.1节。
        4.项目初步范围说明书
        项目初步范围说明书是制订项目初步范围说明书的输出,参见第3章的3.3.2节。
        5.项目管理计划
        项目管理计划是制订项目管理计划的输出,参见第3章的3.3.3节。
        工具与技术
        1.专家判断
        在制订项目范围管理计划时,可利用专家就以往同类项目的范围管理方式所做出的判断。
        2.模板、表格与标准
        模板、表格与标准可能包括范围管理计划模板、工作分解结构模板与项目范围变更控制表格等。
        输出
        项目范围管理计划
        范围管理计划对项目管理团队如何管理项目范围提供了指导。项目范围管理计划的主要内容有:
        .根据项目初步范围说明书编制详细项目范围说明书的过程。
        .根据详细项目范围说明书制订工作分解结构的过程。
        .对已完成项目的可交付物进行正式的确认和接受的过程。
        .控制项目范围说明书变更请求处理方式的过程,该过程与整体变更控制过程相关联。
 
       范围管理
        项目范围是指产生项目产品阶段包括的所有工作及产生这些产品经过的所有过程。它涉及到项目的产品或服务以及实现该产品或服务所需要开展的各项具体工作。项目的范围要求能确保该项目所覆盖的单项工作和整体工作的全部要求,从而促使项目工作成功完成。项目的范围包括两个方面的含义:
        (1)项目产品范围是指客户对项目最终产品或服务所期望包含的特征和功能的总和。项目的产品范围有可能包括单一的产品,也有可能包括多种项目产品。
        (2)项目工作范围是指为了交付满足产品范围要求的产品或服务所必须完成的全部工作的总和。项目的可交付成果可以是一种产品、一项服务或成果。
        项目范围管理是指对项目包括什么与不包括什么的定义与控制过程。这个过程用于确保项目干系人对作为项目结果的项目产品或服务以及生产这些产品或服务所确定的过程有一个共同的理解。项目范围管理主要就是保证项目利益相关者在项目要产生什么样的可交付成果方面达成共识,也要在如何生产这些可交付成果方面达成一定的共识。项目产品范围与项目工作范围的范围管理必须很好地结合,确保项目工作可以得到项目的最终可交付成果。
        项目范围管理包括编制范围管理计划、范围定义、创建工作分解结构(WBS)、范围确认和范围控制5个过程。
        (1)编制范围管理计划。制定一个项目范围管理计划,以规定如何定义、检验、控制范围,以及如何创建与定义工作分解结构。
        (2)范围定义。给出关于项目和产品的详细描述。这些描述写在详细的项目范围说明书里,作为将来项目决策时的基础。
        (3)创建工作分解结构。将项目的可交付物和项目工作细分为更小的、更易于管理的单元。在项目范围管理过程中,最常用的工具就是WBS。工作分解结构是一种以结果为导向的分析方法,用于分析项目所涉及的工作,所有这些工作构成了项目的整个工作范围。WBS为项目进度管理、成本管理和范围变更提供了基础。
        (4)范围确认。决定是否正式接受已完成的项目可交付物。
        (5)范围控制。监控项目和产品的范围状态,管理范围变更。
 
       分析技术
        在整个项目生命周期中,干系人的参与对项目的成功至关重要。应该比较所有干系人的当前参与程度与项目成功所需的参与程度,通过分析识别出当前参与程度与所需参与程度之间的差距,以便制订行动和沟通方案消除差距。
        干系人的参与程度可分为如下类别:
        .不了解:对项目和潜在影响不了解。
        .抵制:了解项目和潜在影响,抵制变更。
        .中立:了解项目,既不支持,也不反对。
        .支持:了解项目和潜在影响,支持变更。
        .领导:了解项目和潜在影响,积极致力于保证项目成功。
 
       评估
        评估测试不只针对物理设备,更重要的是要评估、比较各种网络技术。通常使用模拟测试配置和模拟负载进行子系统(如路由器)和网络技术(如ATM或FDDI等)的评估。评估测试不适用于全局网络,因为全局网络拓扑负载、网络设备太多,不好准确定位引起问题的原因和位置,不能进行有效的比较。多数评估测试在专用的子网测试环境中进行。
        很多公司都有其固定合作的网络设备供应商,如路由器、集线器或交换机的供应商,通常很少再做设备比较测试,但网络技术的比较测试需要经常进行。企业经常面对选择哪种技术以及怎样比较不同技术的问题,所以技术评估是评估测试中很重要的一项。
        在比较设备与技术时,除了使用专用于待测设备或技术的工程负载外,有经验的程序员也使用真实负载,使用真实负载可以了解待测设备或技术在特定环境下的运行性能。通过两种负载模式检测结果的比较,可以获知待测设备还有多少多余容量。
        评估测试与设备或技术的功能/特征测试一样,用于比较待测设备或技术的性能、稳定性、特性、易用性配置和管理等方面的功能。
        评估测试实质是衰减测试的基础,评估测试中对几种设备或技术进行比较;衰减测试中对同一设备的不同版本进行比较。测试中选择设备的标准也完全可作为验证升级版本工作正常与否的标准。尽可能多地集成在计划/设计阶段进行测试是非常好的方法,最初的产品评估测试可以被开发阶段的可接受性测试和升级阶段的衰减性测试所借鉴。
        评估测试是最常进行的测试,在设备选型、技术选型,以及网络系统升级过程中都要进行或多或少的评估测试。
        用于评估测试的负载模式和测试脚本要能有效覆盖被检测的设备和技术。常使用最好情形(工程负载)和真实负载模式进行测试,两种方式都提供了唯一的、重要的检测结果,测试人员要能够理解、解释测试结果间的不同。
        工程检测结果是被测设备和技术在最理想的情形下测试得到的结果,因此不能在真实运行环境里显示它们的运行性能;真实检测结果能很好地显示待测设备或技术在运行网络环境中的性能,但无法预测设备的总容量。如果时间允许,两种测试都要做。通常测试人员只有时间进行一种测试,一般进行最好情形的测试。许多公开发行的测试报告都是基于最好情形(工程负载)下的测试结果。
        所有的测试配置都是模拟的。用于设备比较的测试配置不一定要代表运行网络的典型配置,任何有效、公正的测试配置都能对被测产品进行很好的比较。然而,测试配置和负载越接近运行网络的配置和负载,测试的结果越能反映被测设备在运行网络中的运行情况。
        在安装和配置测试网络时必须注意:要确保配置中所有测试组件都是最新版本,使测试尽可能地公正和统一,以取得最好的测试结果。在测试非正式版时一定要小心,因为发布日期经常有错误。测试配置中安装了非正式版后,它还可能会变,所以非正式版的测试结果和正式版的测试结果经常不一致,分析非正式版的设备经常会延误项目的进行。
        进行评估测试时,除了被测设备,测试配置中的所有网络组件都要保持不变。这一点非常重要,只有这样才能保证被测设备可以进行公平比较。对于子网,这一点很容易做到(一个网络设备很容易被另一个设备所替代)。
        网络技术评估要比较各种网络技术,因而测试配置中的几个网络组件都需要更换。重要的是不要改变源或目标配置。在配置中不仅通信线路需要更换,路由器也需要更换。传输负载和端点的配置要保持不变。
        需要评估测试计划中的各个测试任务,逐步完成测试、数据收集和数据解释。在评估测试中,各测试进行的先后次序没有关系,因为它们不是线性关系,而是多次重复进行的。当在测试中发现了新的信息时,以前所做的测试可能要重新进行以确定它的测试结果,或要对以前的测试稍作改变以检验网络运行的其他方面。此外,在评估期间设备提供商经常发布新的版本或非正式的版本,所以各种基于这种设备的测试都要重新进行。
        制定网络设备、技术比较或取舍标准时,不仅要参考评估测试所得的测试结果数据,还要综合考虑其他一些信息,如各设备的性能价格比,但由于没有运行网络的持续和峰值负载要求,所以缺少比较基准,往往将产品评估测试引入歧途。
        最后要根据评估测试所得的数据和图表对网络系统作出总结性评估,并撰写网络系统评估报告。
 
       收集需求
        收集需求是为实现项目目标而确定、记录并管理干系人的需求的过程,其主要作用是为定义和管理项目范围(包括产品范围)奠定基础。
               输入
                      范围管理计划
                      范围管理计划使项目团队知道应该如何确定所需收集的需求的类型。
                      需求管理计划
                      需求管理计划规定了用于收集需求过程的工作流程,以便定义和记录干系人的需要。
                      干系人管理计划
                      从干系人管理计划中了解干系人的沟通需求和参与程度,以便评估并适应干系人对需求活动的参与程度。
                      干系人登记册
                      从干系人登记册中了解哪些干系人能够提供需求方面的信息。干系人登记册也记录了干系人对项目的主要需求和期望。
                      项目章程
                      从项目章程中了解项目产品、服务或成果的高层级描述,并据此收集详细的需求。
               工具与技术
                      访谈
                      访谈是通过与干系人直接交谈来获取信息的正式或非正式的方法。访谈的典型做法是向被访者提出预设和即兴的问题,并记录他们的回答。访谈有经验的项目参与者、发起人和其他高管,以及主题专家,有助于识别和定义所需产品可交付的成果特征和功能。访谈也可用于获取机密信息。
                      焦点小组
                      焦点小组是召集预定的干系人和主题专家,了解他们对所讨论的产品、服务或成果的期望和态度。由一位受过训练的主持人引导大家进行互动式讨论。焦点小组往往比“一对一”的访谈更热烈。
                      引导式研讨会
                      引导式研讨会把主要干系人召集在一起,通过集中讨论来定义产品需求。研讨会是快速定义跨职能需求和协调干系人差异的重要技术。由于群体互动的特点,被有效引导的研讨会有助于参与者之间建立信任、改进关系、改善沟通,从而有利于干系人达成一致意见。此外,研讨会能够比单项会议更早地发现问题,更快地解决问题。
                      群体创新技术
                      可以组织一些群体活动来识别项目和产品需求。下面是一些常用的群体创新技术:
                      .头脑风暴法:一种用来产生和收集对项目需求与产品需求的多种创意的技术。头脑风暴法本身不包含投票或排序,但常与包含该环节的其他群体创新技术一起使用。
                      .名义小组技术:用于促进头脑风暴的一种技术,通过投票排列最有用的创意,以便进一步开展头脑风暴或优先排序。
                      .概念/思维导图:把从头脑风暴中获得的创意整合成一张图的技术,以反映创意之间的共性与差异,激发新创意。
                      .亲和图:用来对大量创意进行分组的技术,以便进一步审查和分析。
                      .多标准决策分析:借助决策矩阵,用系统分析方法建立诸如风险水平、不确定性和价值收益等多种标准,从而对众多方案进行评估和排序的一种技术。
                      群体决策技术
                      群体决策技术就是为达成某种期望结果,而对多个未来行动方案进行评估的过程。本技术用于生成产品需求,并对产品需求进行归类和优先级排序。
                      达成群体决策的方法有很多,例如:
                      .一致同意:每个人都同意某个行动方案。
                      .大多数原则:获得群体中超过50%人员的支持,就能做出决策。把参与决策的小组人数定为奇数,以防止因平局而无法达成决策。
                      .相对多数原则:根据群体中相对多数者的意见做出决策,即便未能获得大多数人的支持。这种方法通常在候选项超过两个时使用。
                      .独裁:在这种方法中,由某一个人为群体做出决策。
                      在收集需求过程中,上述群体决策技术都可以与群体创新技术联合使用。
                      问卷调查
                      问卷调查是指设计一系列书面问题,向众多受访者快速收集信息。问卷调查方法非常适用于以下情况:受众多样化,需要快速完成调查,受访者地理位置分散,并且适合开展统计分析。
                      观察
                      观察是指直接察看个人在各自的环境中如何执行工作(或任务)和实施流程。当产品使用者难以或不愿清晰说明他们的需求时,就更需要通过观察来了解他们的工作细节。观察,也称为“工作跟踪”,通常由观察者从外部来观看业务专家如何执行工作。也可以由“参与观察者”来观察,他通过实际执行一个流程或程序,来体验该流程或程序是如何实施的,以便挖掘出隐藏的需求。
                      原型法
                      原型法是指在实际制造预期产品之前,先造出该产品的实用模型,并据此征求对需求的早期反馈。原型法支持渐进明细的理念,需要经历从模型创建、用户体验、反馈收集到原型修改的反复循环过程。在经过足够的反馈循环之后,就可以通过原型获得足够的需求信息,从而进入设计或制造阶段。
                      标杆对照
                      标杆对照将实际或计划的做法(如流程和操作过程)与其他可比组织的做法进行比较,以便识别出最佳实践,形成改进意见,并为绩效考核提供依据。标杆对照所采用的可比组织可以是内部的,也可以是外部的。
                      系统交互图
                      系统交互图是范围模型的一个例子,它是对产品范围的可视化描绘,显示业务系统(过程、设备、计算机系统等)及其与人和其他系统(行动者)之间的交互方式。系统交互图显示了业务系统的输入、输入提供者、业务系统的输出和输出接收者。
                      文件分析
                      文件分析就是通过分析现有文档,识别与需求相关的信息,来挖掘需求。可供分析的文档很多,包括商业计划、营销文献、协议、建议邀请书、现行流程、逻辑数据模型、业务规则库、应用软件文档、业务流程或接口文档、用例、其他需求文档、问题日志、政策、程序和法规文件等。
               输出
                      需求文件
                      需求文件描述各种单一需求将如何满足与项目相关的业务需求。一开始,可能只有高层级的需求,随着有关需求信息的增加而逐步细化。只有明确的、可跟踪的、完整的、相互协调的,且主要干系人愿意认可的需求,才能作为基准。需求文件的格式多种多样,既可以是一份按干系人和优先级分类列出全部需求的简单文件,也可以是一份包括内容提要、细节描述和附件等的详细文件。
                      需求文件的主要内容包括:
                      .业务需求
                      可跟踪的业务目标和项目目标。
                      执行组织的业务规则。
                      组织的指导原则。
                      .干系人需求
                      对组织其他领域的影响。
                      对执行组织内部或外部团体的影响。
                      干系人对沟通和报告的需求。
                      .解决方案需求
                      功能和非功能需求。
                      技术和标准合规性需求。?支持和培训的需求。
                      质量需求。
                      报告需求(可用文本记录或用模型展示解决方案需求,也可两者同时使用)。
                      .项目需求
                      服务水平、绩效、安全和合规性等。
                      验收标准。
                      .过渡需求
                      .与需求相关的假设条件、依赖关系和制约因素
                      需求跟踪矩阵
                      需求跟踪矩阵是把产品需求从其来源连接到能满足需求的可交付成果的一种表格。使用需求跟踪矩阵,可以把每个需求与业务目标或项目目标联系起来,这有助于确保每个需求都具有商业价值。需求跟踪矩阵提供了在整个项目生命周期中跟踪需求的一种方法,有助于确保需求文件中被批准的每项需求在项目结束的时候都能交付。需求跟踪矩阵还为管理产品范围变更提供了框架。
                      需求跟踪包括跟踪以下内容:
                      .业务需要、机会、目的和目标。
                      .项目目标。
                      .项目范围/WBS可交付成果。
                      .产品设计。
                      .产品开发。
                      .测试策略和测试场景。
                      .高层级需求到详细需求。
                      应在需求跟踪矩阵中记录每个需求的相关属性。需求跟踪矩阵中记录的典型属性包括唯一标识、需求的文字描述、收录该需求的理由、所有者、来源、优先级别、版本、当前状态和状态日期。为确保干系人满意,可能需要增加一些补充属性,如稳定性、复杂性和验收标准。
 
       数据分析
        数据分析是大数据处理过程中的重要组成部分,是大数据价值体现的核心环节。经典的机器学习方法是最常见的数据智能分析方法,近年来迅速发展的深度学习在某些领域取得了惊人的效果。在应用开发上,也形成了几种主流的大数据处理框架。
        机器学习中算法很多,也有很多不同种类的分类方法,一般分为监督学习和非监督学习(或无监督学习)。其中,监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练,是从标记的训练数据来推断一个功能的机器学习任务。根据训练集中的标识是连续的还是离散的,可以将监督学习分为两类:回归和分类。
        回归是研究一个或一组随机变量对一个或一组属性变量的相依关系的统计分析方法。线性回归模型是假设自变量和因变量满足线性关系。Logistic回归一般用于分类问题,而其本质是线性回归模型,只是在回归的连续值结果上加了一层函数映射。
        分类是机器学习中的一个重要问题,其过程也是从训练集中建立因变量和自变量的映射过程,与回归问题不同的是,分类问题中因变量的取值是离散的,根据因变量的取值范围,可将分类问题分为二分类问题、三分类问题和多分类问题。根据分类采用的策略和思路的不同,分类算法大致包括:基于示例的分类方法,如K最近邻(K-Nearest Neighbor,KNN)方法;基于概率模型的分类方法,如朴素贝叶斯、最大期望算法EM等;基于线性模型的分类方法,如SVM;基于决策模型的分类方法,如C4.5、AdaBoost、随机森林等。
        在实际应用中,缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高,学习模型是为了推断出数据的一些内在结构。因此,根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称为无监督学习。常见的算法有:关联规则挖掘,是从数据背后发现事物之间可能存在的关联或联系。比如数据挖掘领域著名的“啤酒-尿不湿”的故事。K-means算法,基本思想是两个对象的距离越近,其相似度越大;相似度接近的若干对象组成一个簇;算法的目标是从给定数据集中找到紧凑且独立的簇。
        近年来发展起来的深度学习算法是基于原有的神经网络算法发展起来的,包括BP神经网络、深度神经网络。
        BP神经网络是一种反向传播的前馈神经网络,所谓前馈神经网络就是指各神经元分层排列,每个神经元只与前一层的神经元相连,接收前一层的输出,并输出给下一层。所谓反向传播是指从输出层开始沿着相反的方向来逐层调整参数的过程。BP神经网络由输入层、隐含层和输出层组成。
        深度神经网络主要包括卷积神经网络、循环神经网络等,也包括它们的各种改进模型。
        (1)卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,其结构包括输入层、卷积层、池化层、全连接层以及输出层等。该算法在图像处理、模式识别等领域取得了非常好的效果。在CNN的发展过程中,最经典的模型是AlexNet,针对不同的应用需要,又产生了全卷积模型(FCN)、残差神经网络模型(ResNet)、DeepFace等模型结构。
        (2)循环神经网络(Recurrent Neural Network,RNN)是一种人工神经网络,在该网络中,除了层间的连接以外,同层各单元之间连接构成了一个有向图序列,允许它显示一个时间序列的动态时间行为。RNN可以使用它们的内部状态来处理输入序列,这使得它们适用于诸如未分割的、连续的手写识别或语音识别等任务。传统的RNN是很难训练的,往往会出现梯度消失或梯度爆炸等情况,因此又出现了多个扩展版本,如BiRNN、LSTM等。
        随着深度学习的快速发展和应用的普及,开始出现了一些深度学习框架。深度学习框架是一种界面、库或工具,可以使用户在无需深入了解底层算法的细节的情况下,能够更容易、更快速地构建深度学习模型。深度学习框架利用预先构建和优化好的组件集合定义模型,为模型的实现提供了一种清晰而简洁的方法。常见的深度学习框架有:Caffe,是一个广泛使用的开源深度学习框架,支持常用的网络模型,比如Lenet、AlexNet、ZFNet、VGGNet、GoogleNet、ResNet等;TensorFlow,是一个使用数据流图进行数值计算的开源软件库,图中的节点表示数学运算,而图边表示节点之间传递的多维数据阵列(又称张量),其为大多数复杂的深度学习模型预先编写好了代码,比如递归神经网络和卷积神经网络,灵活架构使我们能够在一个或多个CPU(以及GPU)上部署深度学习模型;Keras,是一个由Python编写的开源人工神经网络库,可以作为TensorFlow、Microsoft-CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化,Keras完全模块化并具有可扩展性,并试图简化复杂算法的实现难度。
        随着大数据技术的广泛深入,大数据应用已经形成了庞大的生态系统,很难用一种架构或处理技术覆盖所有应用场景。下文介绍几种当前主流的大数据分布式计算架构。
        Apache Hadoop是用于开发可靠、可伸缩、分布式计算的开源软件,是一套用于在由通用硬件构建的大型集群上运行应用程序的框架。包含的模块有:Hadoop分布式文件系统(HDFS),提供对应用程序数据的高吞吐量访问的分布式文件系统;Hadoop YARN,作业调度和集群资源管理的框架;Hadoop MapReduc,一个用于大型数据集并行处理的基于YARN的系统;Hadoop Ozone,Hadoop的对象存储;Hadoop Submarine,Hadoop的机器学习引擎。
        Apache Spark是加州大学伯克利分校的AMP实验室所开源的类Hadoop MapReduce的通用并行框架。Spark是一个分布式的内存计算框架,是专为大规模数据处理而设计的快速通用的计算引擎。Spark的计算过程保持在内存中,不需要读写HDFS,减少了硬盘读写,提升了计算速度。除了Map和Reduce操作外,Spark还延伸出如filter、flatMap、count、distinct等更丰富的操作。同时通过Spark Streaming支持处理数据流。
        Apache Storm是一个免费的开源分布式实时计算系统,可以可靠地处理无边界的数据流变,可以实现实时处理。Apache Storm速度很快,它是可扩展的,容错的,并且易于设置和操作。Apache Storm应用于实时分析、在线机器学习、连续计算、分布式RPC、ETL等等。Storm的核心是拓扑(Topology),拓扑被提交给集群,由集群中的主控节点分发代码,将任务分配给工作节点执行。
 
       数据分析技术
        从数据在信息系统中的生命周期看,数据分析技术生态主要有5个发展方向,包括数据采集与传输、数据存储与管理、计算处理、查询与分析、可视化展现。在数据采集与传输领域渐渐形成了Sqoop、Flume、Kafka等一系列开源技术,兼顾离线和实时数据的采集和传输。在存储层,HDFS已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,开源社区形成了K-V(key-value)、列式、文档、图这四类NoSQL数据库体系,Redis、HBase、Cassandra、MongoDB、Neo4j等数据库是各个领域的领先者。计算处理引擎方面,Spark已经取代MapReduce成为了大数据平台统一的计算平台,在实时计算领域Flink是Spark Streaming强力的竞争者。在数据查询和分析领域形成了丰富的SQL on Hadoop的解决方案,Hive、HAWQ、Impala、Presto、Spark SQL等技术与传统的大规模并行处理(Massively Parallel Processor,MPP)数据库竞争激烈,Hive还是这个领域当之无愧的王者。在数据可视化领域,敏捷商业智能(Business Intelligence,BI)分析工具Tableau、QlikView通过简单的拖拽来实现数据的复杂展示,是目前最受欢迎的可视化展现方式。
        相比传统的数据库和MPP数据库,Hadoop最初的优势来源于良好的扩展性和对大规模数据的支持,但失去了传统数据库对数据精细化的操作,包括压缩、索引、数据的分配裁剪以及对SQL的支持度。经过10多年的发展,数据分析的技术体系渐渐在完善自己的不足,也融合了很多传统数据库和MPP数据库的优点,从技术的演进来看,大数据技术正在发生以下变化:
        (1)更快。Spark已经替代MapReduce成为了大数据生态的计算框架,以内存计算带来计算性能的大幅提高,尤其是Spark 2.0增加了更多了优化器,计算性能进一步增强。
        (2)流处理的加强。Spark提供一套底层计算引擎来支持批量、SQL分析、机器学习、实时和图处理等多种能力,但其本质还是小批的架构,在流处理要求越来越高的现在,Spark Streaming受到Flink激烈的竞争。
        (3)硬件的变化和硬件能力的充分挖掘。大数据技术体系本质是数据管理系统的一种,受到底层硬件和上层应用的影响。当前硬件的芯片的发展从CPU的单核到多核演变转化为向GPU、FPGA、ASIC等多种类型芯片共存演变。而存储中大量使用SSD来代替SATA盘,NVRAM有可能替换DRAM成为主存。大数据技术势必需要拥抱这些变化,充分兼容和利用这些硬件的特性。
        (4)SQL的支持。从Hive诞生起,Hadoop生态就在积极向SQL靠拢,主要从兼容标准SQL语法和性能等角度来不断优化,层出不穷的SQL on Hadoop技术参考了很多传统数据库的技术。而Greenplum等MPP数据库技术本身从数据库继承而来,在支持SQL和数据精细化操作方面有很大的优势。
        (5)深度学习的支持。深度学习框架出现后,和大数据的计算平台形成了新的竞争局面,以Spark为首的计算平台开始积极探索如何支持深度学习能力,TensorFlow on Spark等解决方案的出现实现了TensorFlow与Spark的无缝连接,更好地解决了两者数据传递的问题。
   题号导航      2023年下半年 信息系统项目管理师 上午试卷 综合知识 (第三批)   本试卷我的完整做题情况  
1 /
2 /
3 /
4 /
5 /
6 /
7 /
8 /
9 /
10 /
11 /
12 /
13 /
14 /
15 /
 
16 /
17 /
18 /
19 /
20 /
21 /
22 /
23 /
24 /
25 /
26 /
27 /
28 /
29 /
30 /
 
第21题    在手机中做本题
    在线人数   共计 6564人 在线 
    cxjcxj1234..     fxa2006@16..     xiaxia_025..     wugangroom..     nuijiashen..     changfengy..
    lishuangye..     cymnj@yaho..     zhenjqing@..     andrelwei@..     kittykishi..     wyunliang7..
    renlijuan_..     lyn_0719@1..     54zephyrsu..     chun554741..     gao2008po@..     daiweide51..
    gaowenyi00..     tuchf@icca..     happy.pine..     liwei@mail..     280863452@..     czs101@126..
    dadola@163..     ailism@126..     luoxiaoyan..     635097875@..     zxf8107100..     wutongyu07..
    happy.pine..     xiaov4@163..     zhuangying..     pcojj@163...     chgl690499..     783505959@..
    yanzhao99@..     852691238@..     lc811002@1..     zqc2008.go..     chien.chen..     tly256688@..

本网站所有产品设计(包括造型,颜色,图案,观感,文字,产品,内容),功能及其展示形式,均已受版权或产权保护。
任何公司及个人不得以任何方式复制部分或全部,违者将依法追究责任,特此声明。
本站部分内容来自互联网或由会员上传,版权归原作者所有。如有问题,请及时联系我们。



京B2-20210865 | 京ICP备2020040059号-5 |京公网安备 11010502032051号 | 营业执照 | Copyright ©2000-2025 All Rights Reserved 软考在线版权所有