免费智能真题库 > 历年试卷 > 多媒体应用设计师 > 2019年下半年 多媒体应用设计师 上午试卷 综合知识
  第35题      
  知识点:   多媒体信息搜索的发展   搜索引擎   索引
  关键词:   搜索引擎        章/节:   多媒体信息搜索技术       

 
未来索引的发展将迈入生活生态圈时代,即是基于(35)的搜索。
 
 
  A.  智能网
 
  B.  云存储
 
  C.  物联网
 
  D.  移动网
 
 
 

   知识点讲解    
   · 多媒体信息搜索的发展    · 搜索引擎    · 索引
 
       多媒体信息搜索的发展
               社会化搜索
               随着Facebook的流行,社交网络平台和应用成为互联网的主流,社交网络平台强调用户之间的联系和交互,这对传统的搜索技术提出了新的挑战。
               传统搜索技术强调搜索结果和用户需求的相关性,社会化搜索除此以外还为用户提供更准确、更值得信任的搜索结果。对于某个搜索结果,传统的结果可能成千上万,但用户社交网络内其他用户发布的信息、点评或验证过的信息则更值得信赖,这是与用户的心理密切相关的。
               实时搜索
               微博等个人媒体平台对搜索引擎的实时性要求日益增高,这也是搜索引擎未来的一个发展方向。实时搜索最突出的特点是时效性强,越来越多的突发事件首次发布在微博上,实时搜索的核心就是“快”,用户发布的信息在第一时间就能被搜索引擎搜索到。
               个性化搜索
               个性化搜索的核心是根据用户的网络行为建立一套准确的个人兴趣模型。而要想建立这样一套模型,就需要收集与用户相关的信息,包括用户搜索历史、点击记录、浏览过的网页、用户的E-mail信息、用户的收藏夹信息、用户发布过的信息、博客、微博等内容,可以从这些信息中提取出用户的个人兴趣关键词信息。
               为不同用户提供个性化的搜索结果是搜索引擎的发展趋势,但现有技术还有很多问题,例如个人隐私的泄露,而且用户的兴趣会不断变化,过于依赖历史信息可能无法反映用户的兴趣变化。
               地理位置感知搜索
               目前,很多手机已经具有GPS应用了,这是基于地理位置感知的搜索,而且可以通过陀螺仪等设备感知用户的朝向,这种信息可以为用户提供准确的地理位置服务以及相关的搜索服务。目前此类应用已经大行其道,例如手机地图App。
               跨语言搜索
               跨语言搜索是指用一种提问语言检索出用另一种语言书写的信息,也就是一种跨越语言界限进行检索的方法。
               如何将中文的用户查询翻译为英文查询,目前主流的方法有三种:机器翻译、双语词典查询和双语语料挖掘方法。对于一个全球性的搜索引擎来说,具备跨语言搜索功能是必然的发展趋势,而其基本的技术路线一般会采用查询翻译和网页的机器翻译这两种技术手段。这方面做得最好的是谷歌,谷歌目前已经支持多种语言之间的跨语言搜索。
               情境搜索
               情境搜索融合了多项技术,上面介绍的社会化搜索、个性化搜索、地理位置感知搜索等都是支持情境搜索的,目前谷歌正在大力提倡这一概念。情境搜索就是指能够感知人与人所处的环境,针对“此时、此地、此人”建立模型,试图理解用户查询的目的,根本目标还是理解人的信息需求。例如某个用户在苹果专卖店附近发出“苹果”这个搜索请求,基于地理位置感知及用户的个性化模型,搜索引擎就有可能认为这个查询是针对苹果公司的产品,而并非对水果的需求。
 
       搜索引擎
        Internet是一个庞大的信息海洋,要想从中找出自己所需的信息并不是一件容易的事,应运而生的搜索引擎可帮了我们的大忙。
        搜索引擎是指为用户提供信息检索服务的程序,通过服务器上特定的程序把Internet上的所有信息分析、整理并归类,以帮助用户在Internet中搜索所需要的信息。当用户通过搜索引擎查找信息时,搜索引擎就会对用户的需求产生响应,并根据查找的关键字检索数据库,最后将与搜索标准匹配的站点列表返回给用户。用户可以从列表中选择需要的网站,单击链接即可进入相应的页面。搜索引擎也是一类网站,它们一般都具备分类主题查询和关键字查询两种功能:
        .按内容分类逐级检索
        分类检索是从搜索首页按照树型的主题分类逐层单击来查找所需信息的方法。
        .使用关键字检索
        关键字检索就是由用户指定一些词语(这些词语称为关键字),搜索引擎自动搜索和这些词语相关的网站,并按照匹配的程度由高到低排列输出给用户。使用关键字检索的核心是如何选择合适的关键字,不同的搜索引擎提供的查询方法并不完全相同。
        对于经常上网查阅资料的用户来说,记住一些好的搜索网站是很重要的,在这里给大家介绍几个常用的搜索网站。
        .http://www.google.com/ google搜索引擎
        .http://dir.sohu.com/搜狐分类搜索引擎
        .http://cn.yahoo.com/中文雅虎
        .http://search.sina.com.cn/新浪搜索
        .http://search.163.com/网易搜索引擎
        .http://www.baidu.com/百度搜索
 
       索引
        在数据库系统中,索引是一种可选结构,其目的是提高数据访问速度。利用索引可提高用户访问数据的速度,或直接从索引中独立检索数据。如果对索引的配置和使用进行了优化,那么索引能大大降低数据文件的I/O操作并提高系统性能。
        但是在为一个表创建索引之后,Oracle将自动维护这个索引。当用户在表中插入、更新或删除记录时,系统将自动更新与该表相关的索引。一个表可以有任意数量的索引,但一个表的索引越多,用户在该表中插入、更新或删除记录时所造成的系统开销也越大。其原因是无论何时更新表,系统都必须更新与之相关的索引。
        索引是建立在表的一个或多个字段之上的。索引的作用大小取决于该字段或字段集的选择性。所谓选择性,是指索引能降低数据集中的程度。如果表中与某个索引相关的字段值各不相同,那么该索引就有很好的选择性。一个选择性很差的索引的例子,是基于字段值仅为true/false的字段创建的索引,因为表中很多记录该字段的字段值都相同。一个索引可能只能帮助管理员降低检索的记录数,而不能惟一地确定一条记录。例如:如果为一个表的LastName字段创建了一个索引,现在用户需要搜索John Smith,那么这个索引将返回LastName字段值为Smith的所有记录,因而用户还不得不在返回的记录中搜索含John的记录。索引的选择性越好,就越有助于降低返回记录的数量,从而提高数据访问速度。下面介绍有效创建和使用索引的技巧和方法。
        . 索引和降低系统处理的数据量。
        索引的主要作用之一就是降低系统处理的数据量。对CPU使用和等待完成I/O操作的时间上,I/O操作引起的系统开销都是非常昂贵的。降低I/O操作可提高系统性能和处理能力。如果不使用索引,那么为了找到特定的数据,系统将不得不扫描表中的所有数据。
        例如如下查询语句:
        
        如果不使用索引,系统必须扫描整个emp表并检查表中每条记录的employee_id字段的值。如果emp表很大,那么这个操作可能意味着数量巨大的I/O读写和很长的处理时间。
        如果为emp表的employee_id字段创建了索引,那么系统将遍历该索引并找到用户所查询记录的ID。找到记录ID之后,只需一条额外的I/O操作就能检索到用户所需的数据。
        用于说明这个问题的最好例子,是只需查找一条记录的情况。在表的每条记录中,类似employee_id这样的字段的值可能在整个表中都是惟一的。这意味着查询结果值返回一条记录,这种查询的效率是非常高的。
        在某些情况下,索引必须返回大量数据。如下面的例子:
        
        这个查询语句很可能返回大量数据,因为索引操作返回了大量记录的ID,并且系统必须独立访问这些记录的ID,所以这种情况下,不使用索引可能比使用索引的效率更高,直接进行表扫描可能效率更高。不同情况下,采用哪种查寻方法更好,很大程度上取决于表的数据量和组织形式。
        对于不同的数据,在某些情况下位图索引可能非常有用,而在另外一些情况下,使用位图索引可能没有任何好处。
        . 索引和更新。
        如果对表创建了索引,那么更新、插入和删除表中的记录都将导致额外的系统开销。在系统提交这些操作之前,系统将会更新所有与该表相关的索引。这可能需要花费很长时间,并额外增加一定的系统开销。
        . 在字段选择性很低的情况下适用索引。
        在某些情况下,表中的某些字段的选择性可能很低。开发人员没必要为所有表创建索引,实事上,在某些情况下索引引起的问题比解决的问题更多。在很多情况下,需要反复试验,才能确定一个索引是否有助于提高系统性能。
        但是,位图索引能在字段选择性不高的情况下工作得很好。一个位图索引可以和其他位图索引联合使用,以降低系统检索的数据集。对于某些值为true/false、yes/no或其他小范围数据的字段,建立位图索引是非常合适的。请记住:位图索引所占用的空间,是随着与该索引相关的字段的不同值的数量的增加而增加的。
        如果决定创建一个索引,那么确定为哪些字段创建索引是非常重要的。对于不同的表,可能会选择一个或多个字段创建索引。可使用如下方法来确定在哪些字段上创建索引:
        ①选择那些最常出现在where子句中的字段。经常被访问的字段最可能受益于索引。
        ②经常用于连接表的字段是创建索引的必然候选字段。
        ③必须注意索引导致的查询语句性能的提高与更新数据时性能的降低之间的平衡。
        ④经常被修改的字段不适合创建索引,其原因是,更新索引将增加系统开销。
        在某些情况下,使用复合索引的效率可能比使用简单索引的效率更高。下面的一些例子说明了应当在何种情况下使用复合索引。
        ①某两个字段单独来看都不具有惟一性,但结合在一起却有惟一性,那么这种情况下,复合索引将工作得很好。例如:A字段和B字段都几乎没有惟一性值,但绝大多数情况下,字段A和B的某个特定组合却具有惟一性特点。那么在检索数据时,可在where子句重视and操作符来将这两个字段连接在一起。
        ②如果select语句中的所有值都位于复合索引中,那么Oracle将不会检索表,而直接从索引中返回数据。
        ③如果多个查询语句的where子句中作为查询条件的字段都不相同,但返回的记录相同,那么应当考虑利用这些字段创建一个复合索引。
        在创建索引之后,开发人员应当定期利用SQL TRACE工具或EXPLAIN PLAN来察看用户查询是否充分利用了索引。很有必要花费一定精力来试验使用索引和未使用索引在效率上的差别,以判断索引所耗费资源是否物有所值。
        应该删除那些不经常使用的索引。可使用alter index monitoring usage语句来跟踪索引的使用情况。还可以从系统表all_indexes、user_indexes和dba_indexes中查询用户访问索引的频率。
        如果为一个不适合创建索引的字段或表创建了索引,那么这可能会导致系统能力的下降。而如果创建的索引合理,那么这将降低系统的I/O操作并加快访问速度,从而大大提高系统性能。
   题号导航      2019年下半年 多媒体应用设计师 上午试卷 综合知识   本试卷我的完整做题情况  
1 /
2 /
3 /
4 /
5 /
6 /
7 /
8 /
9 /
10 /
11 /
12 /
13 /
14 /
15 /
 
16 /
17 /
18 /
19 /
20 /
21 /
22 /
23 /
24 /
25 /
26 /
27 /
28 /
29 /
30 /
 
31 /
32 /
33 /
34 /
35 /
36 /
37 /
38 /
39 /
40 /
41 /
42 /
43 /
44 /
45 /
 
46 /
47 /
48 /
49 /
50 /
51 /
52 /
53 /
54 /
55 /
56 /
57 /
58 /
59 /
60 /
 
61 /
62 /
63 /
64 /
65 /
66 /
67 /
68 /
69 /
70 /
71 /
72 /
73 /
74 /
75 /
 
第35题    在手机中做本题