为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

信息检索 复习资料

2017-09-19 17页 doc 89KB 190阅读

用户头像

is_447713

暂无简介

举报
信息检索 复习资料第一部分:基本常识 1.文献按照出版形式可分为哪几种类型?举例。 图书、期刊、报纸、特种文献。 图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等 期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。 报纸:人民日报 特种文献:科技报告、会议文献、专利文献、学位论文...
信息检索 复习资料
第一部分:基本常识 1.文献按照出版形式可分为哪几种类型?举例。 图书、期刊、报纸、特种文献。 图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等 期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI期刊数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。 报纸:人民日报 特种文献:科技报告、会议文献、专利文献、学位、政府出版物、文献、产品资料、科技档案 美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。 2现代科技文献具有的特点哪些? 答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降 3什么是核心文献、相关文献和边缘文献? 答: 核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。如核心期刊等。 相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。 4 什么是文献?构成文献的有哪四个要素? 答:文献的定义是记录有知识的一切载体称为文献。构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。 5 电子文献的主要类型和文件格式是什么? 答: (1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分; (2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的 gif文件、jpg文件以及标记文件格式的 html文件和xml文件之分; (3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分; (4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分; (5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类; (6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。 6 如何针对不同时间要求的文献信息,选用不同的文献信息源? 答:以信息利用者的观点,针对不同时间要求的文献信息应该使用不同的文献信息类型。例如,查找当前最新的信息(一、两个月之内的信息),应该通过互联网以及当前最新的报纸、期刊、广播、电视等媒体;两个月之前到十年之内的信息应主要通过网上图书、期刊类的数据库解决;5~20年前的信息应除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。 7什么是ISSN和ISBN? 答:ISSN是国际标准连续出版物号(International Standard Serial Number,简称ISSN)。 ISBN是国际标准书号(International Standard Book Number,简称ISBN)。 8信息索原理是什么? 信息检索的原理可以表述为将检索提问标识与存贮在检索工具中的标引标识进行比较,含有两者一致或信息标引的标识包含着检索提问标识的信息就是检索命中的信息。 9什么是文献的内容特征和外表特征?这两者有何区别? 与文献信息主内容没有关系或关系不大的信息称为文献信息的外表特征,例如,著者、著者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。与文献信息主题内容密切相关的信息称为文献信息的内容特征。文献信息内容特征主要有各种形式的主题词和分类号。文献的标题因常常能够反映文献的主题,常被归入内容特征的范畴。 内容特征和外表特征的区别是:与文献信息内容特征的关系密切的是内容特征,反之是外表特征。 10国内通用的分类法有哪两种?它们的类号设置有什么主要区别? 国内通用两种分类法是《中国图书馆分类法》和《中国科学院图书分类法》。它们的类号设置的区别是《中国图书馆分类法》混合使用字母和数字,而《中国科学院图书分类法》使用纯数字作为类号。 11分类法中的上位类、下位类和同位类? 在《中图法》以及任何类似的分类表中,被区分的类称为上位类。相对地说,区分出来的类就是下位类。处于同一上位类下的同一层次的下位类称为同位类。 12多概念主题的文献如何确定分类号? 给多概念课题确定分类号的方法,首先需要应用单概念课题分类方法,其次要区分属于并列概念课题还是应用性课题。如果是并列概念课题,凡是有主次者,应取其重点或主要研究对象归类;凡是无主次的,课题所涉及的类别都应该查找。如果属于应用性课题,应用于一个领域的应在所应用或受影响的类目中查找。应用于多个领域的则在该理论、方法、工艺等本身所属的类目中查找。 13什么是关键词?什么是主题词?简述它的特征和适用场合? 关键词,属于自然语言的范畴,未经规范化处理,也不受主题词表的控制,只从字面抽 取,直接以作者在文献中的用词作检索,基本上不对词语加以控制。如:对于“电子计算机”这一概念,可有电脑、计算机、微机、PC等不同形式来表达。 主题词,是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。如:对于电子计算机、电脑、计算机、微机、PC等表达同一概念的不同书写形式规范为“计算机”。主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。 因此,为了达到较高的查准率和查全率,如果检索工具提供了主题词这一检索途径的话就应该选择主题词来进行检索,而不应该选择关键词。选用主题词途径检索 , 既能满足较高的查准率、查全率,又能提高检索速度。关键词它适合于检索新近出现的信息,或者实施查全率要求不高的检索。 14简述二次文献的类型? 二次文献分为目录、题录、索引、文摘四种。目录是一批相关文献信息的著录集合,它以报道文献出版或收藏信息为主要功能的工具。 题录是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成的,供人们查找篇目出处的工具。 索引是将书刊内容中所论及的篇名、语词、主题等项目,按照一定的排检方法加以编制,注明出处,供读者查检使用的检索工具。索引是对文献内容较深人的揭示。    文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。     索引与目录的根本区别就在于著录的对象不同,目录所著录的是一个完整的出版单位,如一种图书、一种期刊等,而索引所著录的则是完整的出版物的某一部分、某一观点、某一知识单元,因此,索引能解决目录只对文献作整体的宏观著录的不足,满足读者对文献内容单元的微观揭示和检索的要求,提高文献检索的深度和检索效率。    目录:按次序编排供查考的图书或篇章的名目    题录:只含著录事项而无摘要的文献款目。如果含摘要,则一般称为文摘。    文摘:又摘要,对文献的主要内容所做的简略而确切的叙述,一般不加评论、补充或解释。    索引:索引侧重于让你找到要找的文章,目录侧重于显示整篇文章的结构 15.论述信息检索的步骤? (1)分析研究课题,明确检索要求:分析课题的主要内容、确定课题的文献类型、确定 检索时间范围、分析用户的检索评价要求 (2)选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具书,不同 的资料类型就应该选用不同的数据库 (3)确定检索策略:确定检索途径、制定检索策略 (4)调整检索方案:确定了具体的检索方法之后,就要利用所用数据库,在一定的年代 范围内具体查找,以获得文献线索。用户对每次检索结果在作出判断,并对检索策略做 出相应的修改和调整,知道得到满意的结果 (5)获取原文:利用全文数据库直接获取,利用文献传递系统获取、利用文摘数据库的 原文服务、利用OPAC检索系统,进行馆际互借。 16什么是追溯法?它有什么优缺点? 追溯法又称回溯法,它是从已有的文献后面所附的参考文献入手,逐一追查原文的方法。其优点是:在没有检索工具或检查工具不齐全的情况下,借助此种方法,也可以查得一批有关文献信息。其缺点是:原文作者引用的参考文献是有限的,不可能列出全部有关文献,而且有的引用文献又与原文关系并不密切,参考价值不大。因此用此法查找文献比较费时,漏检和误检的可能性较大。 17什么是数据库,它的结构由哪几部分组成? 按照国际标准组织标准ISO/DIS5127规定,数据库是指至少由一种文档(file)组成,能满足特定目的或特定功能数据处理系统需要的数据集合。 从使用者观点观察, 数据库主要由“文档——记录——字段”三个层次构成。 18 什么场合可以使用截词方法?(举例说明) 当某些英语检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词符,或称通配符扩展检索词。截词检索可以扩大检索结果。 19使用截词检索应注意的哪些问题? 使用截词方法时需注意四个问题:一是截词符要紧接在词干后面,截词符和词干之间不能有空格。二是避免将检索词的词干截得过短,一般应在三个字母以上。三是截词应该合理使用。一般不可能出现词尾变化的单词其后不必再使用截词。四是从希望出现的单词中取尽可能多的公共字母作为词干,以提高查准率。 20什么是布尔逻辑算符? 布尔逻辑算符一般有哪几种? 规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑或(OR)、逻辑与(AND)和逻辑非(NOT)。 21优先算符“( )”有什么作用? 优先算符“( )”的作用是在多个逻辑符号混合使用时,改变它们的运算顺序。布尔逻辑运算符的优先级顺序:()〉NOT〉AND〉OR. 22什么是位置算符?它在文献检索中起什么作用? 位置算符又称邻接算符,适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。位置算符是提高检索查准率的一种重要手段。 23需要扩大检索范围时,如何调整检索策略? 需要扩大检索范围,调整策略的方法有:①减少“与(AND)”算符,增加同义词或同族相关词用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符“?”;③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。 24需要缩小检索范围时,如何调整检索策略? 缩小检索范围,调整策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限制检索词在指定的基本字段出现,或者指定辅助字段,限制结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用逻辑非(NOT)算符,排除无关概念。 25 CNKI中国期刊全文数据库共有几种基本的检索方法?   共有三种,它们是:    分类导航。利用系统提供的专辑栏目及其展开的分类导航树查找相关文献,适用于对一个学科的文献做全面调查的场合。   初级检索。是利用检索项对某个指定字段进行的检索。    高级检索。是指设置多个检索条件和逻辑组合关系,查找同时满足这些条件和逻辑关系的文献。 26 简述CNKI中国期刊全文数据库的二次检索?它是否只能检索二次?   二次检索是在前次检索结果的范围内再次进行查找,以达到缩小检索范围,使检索结果逐步接近课题要求的目的。其作用相当于在前后两次检索之间做逻辑与(AND)运算。不管是初级还是高级检索界面,只要检索结果的篇数允许,二次检索可以反复做,直到满足课题要求为止。 27 CNKI中国期刊全文数据库初级检索和高级检索的区别在那里?   区别在二个方面:   1)检索的字段数量不同。初级检索的字段数量只有一个,因此,它每次只能检索对一个检索字段的检索词进行检索。高级检索的字段有两个,它可以同时对两个不同的检索字段的检索词进行检索。   2)检索的布尔逻辑算符不同。初级检索的字段数量只有一个,即利用二次检索对前一次检索结果的"与"检索。在高级检索中除了可以利用的字段有两个,利用二次检索对前一次检索结果的"与"检索之外,它可以同时对两个不同的检索字段的检索词进行"或"和检索。 28 CNKI期刊全文及博硕士论文数据库、CNKI中国期刊全文数据库用的是什么浏览器?此全文浏览器有什么作用?万方数据资源系统阅读全文使用的是什么格式浏览器?超星电子图书使用什么阅读器?   中国期刊网的CAJ 全文浏览器的作用是为了浏览这个数据库的全文使用的。支持中国期刊网全文数据库中全文CAJ文件的浏览器(需要WINZIP解压),它可以在该数据库首页上下载。如果事先在计算机上没有安装这个浏览器,将无法阅读该数据库的全文。 29计算机信息检索?计算机检索的步骤?如何评判检索结果?     计算机检索是指人们在计算机或计算机网络的终端机上,用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检出需要的信息,继而再由终端设备显示或打印的全过程。其步骤包含以下几个方面:     (1)分析检索需要;     (2)选择检索系统和数据库;     (3)检索途径的选择;     (4)确定检索词;     (5)编制检索表达式;     (6)检索结果分析。     对于检索结果的评价目前普遍采用查全率和查准率来衡量(评价)检索结果 对用户文献需求的满足程度。     (1)、查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相 关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检 索出来;     (2)、查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的 比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。 30信息检索途径     (一)     (1)、著者途径:许多检索系统备有著者索引、机构(机构著者或著者所在机构)索引,专利文献检索系统有专利权人索引,利用这些索引从著者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为著者途径。  (2)、题名包括书名、刊名、篇名等途径:一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录。  (3)、分类途径:按学科分类体系来检索文献。这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属范围来查找文献资料,并且可以起到"触类旁通"的作用。从分类途经检索文献资料,主要是利用分类目录和分类索引。  (4)、主题途径:通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。  (5)、引文途径:文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。  (6)、序号途径:有些文献有特定的序号,如专利号、报告号、号、标准号、国际标准书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。  (7)、代码途径:利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。  (8)、专门项目途径:从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。 (二) (1)主题途径:通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。 (2)分类途径:分类途径是从文献内容所属的学科类别出发来检索文献,利用相应检索工具的分类目录和分类索引检索到相关内容。这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属范围来查找文献资料,并且可以起到"触类旁通"的作用。 (3)作者途径:作者途径是从文献 的作者姓名出发来检索其文献。“作者”广义上还应该包括汇编者、编者、译者、主办者、代表机构、单位的团体作者等。 (4)题名途径:直接利用信息的题名查找信息的方法。它包括信息标题名、图书名、刊名、标准名、文档名、数据库名等。 (5)引文途径:文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。 (6)号码途径:利用信息的号码获取相关信息的方法。号码包括文献的编号、代码等。如专利号、报告号、合同号、标准号、国际标准书号和刊号等。 (7)其他途径(专门项目途径):从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题 31文献检索方法 1.直接法:又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、倒查法和抽查法。  (1)顺查法:顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。  (2)倒查法:倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。  (3)抽查法:抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 2.追溯法:是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。 3.循环法:又称分段法或综合法。它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。 32什么是核心期刊?如何鉴别高质量期刊?什么是相关期刊和边缘期刊?什么是期刊的影响因子?     核心期刊是学术界通过一整套科学的方法,对于期刊质量进行跟踪评价,并以情报学理论为基础,将期刊进行分类定级,把最为重要的一级称之为核心期刊。     国内外公认的鉴别方式有二:核心期刊和同行评审期刊。     核心期刊是指刊载某一学科或专业有关的信息较多,且学术水平较高,能够反映该学科最新成果和前沿动态,受到该专业读者特别关注并成为检索与阅读首选的那些期刊。核心期刊的确定一般运用文献计量学的方法,通过对期刊和刊载论文的一些计量指标的统计和分析来确定。     在我国(不含港、澳、台),对出版的期刊中核心期刊的认定,目前国内比较权威的有两种版本。一是中国科技信息研究所(简称中信所)每年出一次的《中国科技期刊引证报告》;另一种是北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版的《中文核心期刊要目总览》。《要目总览》不定期出版,每四年出一版,现在是2012年版。《要目总览》收编包括社会科学和自然科学等各种学科类别的中文期刊。《引证报告》统计源期刊的选取原则和《要目总览》核心期刊的认定各依据了不同的方法体系,所以二者界定的核心期刊(指科技类)不完全一致。 同行评审期刊是国外高水平期刊对来稿评审普遍采取的方式。具体做法是:作者将文稿寄交编辑部并经初审合格后,为了审查论文的学术质量需将论文稿送交有关专家(即同行)进行审阅。所选专家来自不同的机构,他们一般对该刊物比较了解,而且有相当高的专业背景和造诣,大多都有投稿的经历或本身就是高产作者。同行评审的主要目的是对稿件的质量进行控制,确保提交的论文是可读的、可信的和有意义的。因此,人们普遍认为同行评审期刊的学术水平高于一般期刊。 相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。 某刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。这是一个国际上通行的期刊评价指标。 33.什么是文献?按照内容层次可分为哪几种文献,并举例说明? 答:文献是记录有知识的一切载体。(或:用文字、图形、符号或声像、视频等技术手段记录知识信息的物质载体。) 一次文献:通常是指原始创作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献,主要包括期刊论文、专利说明书、会议论文、科技报告和学位论文。 二次文献:是指为了管理和利用一次文献,由文献信息工作者对其进行加工整理后所得到的产物,包括书目、索引、文摘等 三次文献:是指利用二次文献,选用一次文献内容而编纂出的成果,如词典、手册、年鉴、百科全书、专著和、教科书、论文丛集、术语、文献指南以及书目的目录等。 34.三大检索工具SCI,EI和ISTP?     (1)SCI ,即《科学引文索引》,是自然科学领域基础理论学科方面的重要期刊文摘索引数据库。它创建于1961 年,创始人为美国科学情报研究所所长 Eugene Garfield(1925.9.15). 利用它,可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自1945 年以来重要的学术成果信息;SCI 还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据。     (2)Ei,即《工程索引》,创刊于1884年,由Elsevier Engineering Information Inc. 编辑出版。 主要收录工程技术领域的论文(主要为科技期刊和会议录论文) ,数据覆盖了核技术、生物 工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据 处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、 汽车工程等学科领域。     (3)ISTP ,即《科学技术会议录索引》,创刊于1978年,由美国科学情报研究所编制, 主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、医学、工程、计算机科学、化学、物理学等学科。 35.信息的存储过程包括信息的选择、信息的收集和形成有序可检的信息集合。 36.搜索引擎的评价指标主要包括查全率(recall)、查准率(precisions);收集网络站点数目的广泛性;数据库更新频率和时效性;使用的便利性;目录设置的合理性;分类的深度和广度。 37.输出结果和检索效率评价标准:查全率、查准率(什么是查全率,什么是查准率) 38.不确切位置检索所使用的检索方式:模糊检索匹配 39什么是信息素质(信息素养)?信息素质(信息素养)的核心是什么?如何判定自己的信息素质?如何培养自己的信息素质? 40.按照加工层次分,科技文献分为哪几种?什么是一、二、三次文献? 41.什么是Calis: calis是中国高等教育文献保障系统的简称,是经国务院批准的我国高等教育公共服务体系之一。它以系统化、数字化的学术信息资源为基础,以先进的数字图书馆技术为手段,建立包括文献获取环境、参考咨询环境、教学辅助环境、科研环境、培训环境和个性化服务环境在内的六大数字服务环境,为高等院校教学、科研和重点学科建设提供高效率、全方位的文献信息保障与服务,成为中国经济和社会发展的重要基础设施。 42.什么是引证文献?什么是同引文献?什么是学科导航?什么是知识产权?什么是追溯法? 43.什么是搜索引擎?搜索引擎的种类有?提高搜索引擎检索效果的方法? 44.《中国图书馆分类法》简称?将所有学科门类分成几个部类?几个大类? 45.知识产权作为一种法律制度,是相关法律的集合,其包含有哪些法律?我国《著作权法》规定,公民作品的财产权利保护期限为作者有生之年加死亡后多少年。    46利用Google搜索引擎查找网络信息资源时,如果只希望获得关于“职业生涯规划”的pdf格式文档信息,正确的检索式:职业生涯规划filetype:pdf 47我国自1985年4月1日起施行专利法,我国专利及其保护年限为:发明专利20年、实用新型专利10年、外观设计专利10年。 48.按文献出版形式分,特种文献有哪些?:特种文献有:科技报告、专利文献、标准文献、会议文献、学位论文、政府出版物、产品资料、其他资料(如档案资料、地图、乐谱等零散文献)。 49.美国政府的四大科技报告是什么? 50需要扩大检索范围时,如何调整检索策略?需要缩小检索范围时,如何调整检索策略?     需要扩大检索范围,调整策略的方法有:①减少“与(AND)”算符,增加同义词或同族相关词用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符“?”;③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。 需要缩小检索范围,调整策略的方法有:①减少同义词或同族相关词;②增加限制概念,用逻辑与(AND)将它们连接起来;③使用字段限制,或者限制检索词在指定的基本字段出现,或者指定辅助字段,限制结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用逻辑非(NOT)算符,排除无关概念。 辑与和逻辑或混合运算。答案②逻辑与和逻辑或混合运算,同时使用了优先算符) 51.在数据库检索中,当检出的文献数量较少时,分析其可能原因,以及采用何种对应措施,才能增大文献信息的检出量?(至少列举5种情况) 答:在数据库检索中,当检出的文献数量较少时,可能是以下原因造成的: ①检索词拼写错误; ②遗漏重要的同义词或者隐含概念; ③检索词过于冷僻具体; ④没有使用截词算符; ⑤位置算符和字段算符使用过多; ⑥使用过多的逻辑“与”,过于严格。 ⑦被检索的数据库数量较少 因此需要扩大检索范围,增加文献信息的检出量,具体措施如下: ①减少“与(AND)”算符,以0R加入相关检索词;以0R加入所有下位叙词;加入上位词;采用上位类;排除数据库中的普遍概念。 ②在词干相同的单词后使用截词符(?); ③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。 ④修正错误的检索词; ⑤补充足够的问义词, ⑥把叙词作为紧邻关键词使用; ⑦选用登录数高的索引词; ⑧放弃单库检索,选择跨库检索。 52.什么是常用检索工具?常用的中文数据库和外文数据库有哪些?常用的搜索引擎有哪些?分别举例说明。(教材) 第二部分  互联网信息检索原理常见问题 1.从信息利用的角度考察,互联网信息资源由哪三方面构成? 答:从信息利用的角度考察,互联网信息资源由连接在网上的计算机中的无数信息、网上的各种信息工具以及网络通信渠道三方面构成。 2.简述网站和网页的关系? 网页是用HTML或DHTML、XML等语言写成的文本文件。而网站则是有独立的域名,由若干相关网页组成的一个站点。按照微软公司的比喻,如果把WWW当作是Internet上的大型图书馆,则每个Web站点就是一本书,每个Web页面就是书的一页。 3.为什么说网络学术信息不能唾手可得? 原因主要有三: 一是查找主页信息通常要通过查找搜索引擎之类的中介数据库才能进行。而使用这些工具需要一些专门的技术,希望高效率地查找网络信息时尤其如此。 二是一般情况下只使用一两种搜索引擎所得的结果往往是沧海一粟。 三是互联网上学术类与非学术类信息的比例是1:10。再则,网上学术信息很多是以不可见资源形式存在着。因此查找网上信息的难度更大一些。 4.按工作方式区分的搜索引擎有哪三类搜索引擎? 按照工作方式的不同,搜索引擎可以分为主题引擎、目录引擎和多元引擎。 5.请举出典型的国外和国内主题引擎各一个? 国外主题引擎的代表是Google,国内代表为百度。 6.为什么主题引擎的分类途径不如目录指南型引擎?   主题搜索引擎提供的分类途径或者为自动分类的结果,或是借用其他目录引擎的分类数据(例如Google利用网景公司的Open Directory分类),因而分类检索效果不如由人工仔细分类的目录指南型搜索引擎。 7.简述中外问搜索引擎的主要区别。 中文引擎可以使用英语等外文查找信息,外文引擎也可以使用中文;因而这两种引擎的区别不在于使用的语言,而在于收集和处理信息的侧重点。中文引擎主要收集和处理的信息是中文网页,查找中文资料的效果通常胜过外文引擎。反之,如果需要查找英文信息,直接使用境外英文引擎效果更好。 8.简述百度引擎的三种逻辑运算符。 逻辑与为空格,逻辑或为“|”,逻辑非为“ -”. 9.什么是虚拟图书馆? 虚拟图书馆是一种网络信息利用工具。它针对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。 10.简述使用虚拟图书馆的场合? 使用虚拟图书馆查找信息的场合为:当时间短促,不允许浏览由搜索引擎查得的巨量的信息时;当希望看到比较可靠的网络信息;当希望对某个领域有个整体的、较全面的了解时。 11.能否以网上信息资源完全代替印刷型文献。哪一些文献的全文更适合从网上获得? 目前,网上信息资源不能完全代替印刷型文献,尤其是学术型文献。近几年的国内学术期刊文献、部分国外学术期刊文献和部分专利文献,比较适合于通过网络获取。 检索 12.媒体和多媒体的概念 所谓媒体medium,即指承载信息的载体。 多媒体技术,指以数字化为基础,能够对多种媒体信息进行采集、编码、存储、传输和表现,综合处理多种媒体信息并建立有机的逻辑联系,集成为一个存取系统使之具有良好交互性的技术。 多媒体系统是一个由多媒体终端设备、多媒体网络设备、多媒体服务系统、多媒体软件及有关媒体数据组成的有机整体。从广义上讲,这是信息系统的一种新的形式—多媒体信息系统。 13常见媒体 (1)音频 (2)图像 (3)视频 (4)文本 14全文数据库的特点?     与其他数据库或信息源相比,全文数据库有许多优点,主要表现在以下几方面:   (1)可直接利用。用户检索全文数据库得到的结果是原始文献的全文信息,而不像书目数据库那样得到的是文摘或书目之类的二次文献,从而省去了通过二次文献去查找一次文献的环节。因而,全文数据库又称为自足性数据库。   (2)简化数据标引和建库工作。绝大多数全文数据库采取自然语言的计算机自动标引技术,节省了大量的人力、物力和财力。此外,全文库的建立还可以省去许多用户并不关心的著录项目,比如出版介质、出版单位、印刷单位、价格等等,这些信息对用户的检索意义不大,但是却在书目数据库的创建中占用了信息加工人员的大量精力。   (3)避免了文献二次加工中人为的差错。由于全文数据库包括了二次文献和参考文献在内的几乎所有数据,而这些数据均出自原文,从而避免了文献二次加工可能出现的差错。   (4)后处理能力强。由于全文数据库收录的是全文信息,且数据库的容量都比较大,容易产生检索结果中包含一些不相关的信息,因此,全文检索系统一般会对实施检索所得到的检索结果进行各种优化,诸如检索结果的聚类、图形图像的处理、信息过滤、反馈机制的使用等。通过增强检索系统的后处理能力,可以进一步满足用户个性化检索需求。   (5)信息量非常大,对检索技术的要求很高。 15.什么是网络免费学术资源,其特点和主要内容形式有哪些? 16.OA开放获取? 第三部分  特种文献 专利 1. 专利的历史     世界上最早的专利法于1474年诞生于威尼斯共和国,英国于1624年颁布垄断法,美国于1790年制定专利法,1836年成立美国专利局,1885年(明治18年)4月18日日本第一部专利法生效。中国第一部专利法于1985年4月1日施行。 专利的功能是保护发明创造,鼓励发明创造,有利于发明创造的推广应用,促进科学技术的发展。 2.在我国,专利包括哪几个种类?保住年限分别是多少年?请说出ZL200210000001.1的含义 三种,分别是发明专利、实用新型专利、外观设计专利。 ZL200210000001.1是我国2002年以后的一个专利号,请说明此专利号的含义:ZL是“专利”的拼音缩写,前四位为第一段2002,表示申请年是2002年,第二段是第五位,表示申请的种类,1代表发明专利,2是实用新型,3是外观设计。第三段由第六至十二位组成,代表当年该类别申请的序号数。第四段由最后一位数字或符号组成,是计算机自动生成的校验位,由计算机给予。 3.什么是专利文献?解释IPC的含义。 标准文献 1.什么是标准?标准的分类? 外文数据库检索  1.简述springer数据库的截词算符及其使用方法。 截词算符有“*”和“?”两个。“*”用作左截断、右截断或者中间多字符屏蔽算符。例如,左截断“*sorption”返回的结果中含有“adsorption”,“absorption”,和“desorption”等。 右截断“color*”的文献结果中含有“color”,“colored”,“colors”和“Colorado”等。中间屏蔽“h*emoglobin”的结果中含有“hemoglobin”或“haemoglobin”。“?”用作单字符中间屏蔽算符。例如,“t??th”的检索结果中可以含有“tooth”,“teeth”,“truth”和“tenth”等。必须注意,位置算符不可与优先算符并用。 2.在springer数据库检索中,检索策略gear*,“vehicle gear”,vehicle near gear,(car or truck) and gear,((car or truck) and gear) wn ti中使用的算符。  gear* (使用截词符“*”) “vehicle gear” (使用词组算符)  vehicle near gear (使用位置算符“near”) (car or truck) and gear (逻辑与和逻辑或混合运算,同时使用了优先算符) ((car or truck) and gear) wn ti (在题目字段中做逻辑与和逻辑或混合运算,同时使用了位置算符) 3.布尔逻辑表达式“energy(能源)NOT nuclear(核能)”的检索结果是什么? 检索结果:“有关能源方面”的文献信息,但不包括核能。4、写出检索式“computer *”的检索结果,至少须写出3个以上? compute computer computing computability computable computation computational computative   (1)可直接利用。用户检索全文数据库得到的结果是原始文献的全文信息,而不像书目数据库那样得到的是文摘或书目之类的二次文献,从而省去了通过二次文献去查找一次文献的环节。因而,全文数据库又称为自足性数据库。   (2)简化数据标引和建库工作。绝大多数全文数据库采取自然语言的计算机自动标引技术,节省了大量的人力、物力和财力。此外,全文库的建立还可以省去许多用户并不关心的著录项目,比如出版介质、出版单位、印刷单位、价格等等,这些信息对用户的检索意义不大,但是却在书目数据库的创建中占用了信息加工人员的大量精力。   (3)避免了文献二次加工中人为的差错。由于全文数据库包括了二次文献和参考文献在内的几乎所有数据,而这些数据均出自原文,从而避免了文献二次加工可能出现的差错。   (4)后处理能力强。由于全文数据库收录的是全文信息,且数据库的容量都比较大,容易产生检索结果中包含一些不相关的信息,因此,全文检索系统一般会对实施检索所得到的检索结果进行各种优化,诸如检索结果的聚类、图形图像的处理、信息过滤、反馈机制的使用等。通过增强检索系统的后处理能力,可以进一步满足用户个性化检索需求。   (5)信息量非常大,对检索技术的要求很高。 15.什么是网络免费学术资源,其特点和主要内容形式有哪些? 16.OA开放获取? 第三部分  特种文献 专利 1. 专利的历史     世界上最早的专利法于1474年诞生于威尼斯共和国,英国于1624年颁布垄断法,美国于1790年制定专利法,1836年成立美国专利局,1885年(明治18年)4月18日日本第一部专利法生效。中国第一部专利法于1985年4月1日施行。 专利的功能是保护发明创造,鼓励发明创造,有利于发明创造的推广应用,促进科学技术的发展。 2.在我国,专利包括哪几个种类?保住年限分别是多少年?请说出ZL200210000001.1的含义 三种,分别是发明专利、实用新型专利、外观设计专利。 ZL200210000001.1是我国2002年以后的一个专利号,请说明此专利号的含义:ZL是“专利”的拼音缩写,前四位为第一段2002,表示申请年是2002年,第二段是第五位,表示申请的种类,1代表发明专利,2是实用新型,3是外观设计。第三段由第六至十二位组成,代表当年该类别申请的序号数。第四段由最后一位数字或符号组成,是计算机自动生成的校验位,由计算机给予。 3.什么是专利文献?解释IPC的含义。 标准文献 1.什么是标准?标准的分类? 外文数据库检索  1.简述springer数据库的截词算符及其使用方法。 截词算符有“*”和“?”两个。“*”用作左截断、右截断或者中间多字符屏蔽算符。例如,左截断“*sorption”返回的结果中含有“adsorption”,“absorption”,和“desorption”等。 右截断“color*”的文献结果中含有“color”,“colored”,“colors”和“Colorado”等。中间屏蔽“h*emoglobin”的结果中含有“hemoglobin”或“haemoglobin”。“?”用作单字符中间屏蔽算符。例如,“t??th”的检索结果中可以含有“tooth”,“teeth”,“truth”和“tenth”等。必须注意,位置算符不可与优先算符并用。 2.在springer数据库检索中,检索策略gear*,“vehicle gear”,vehicle near gear,(car or truck) and gear,((car or truck) and gear) wn ti中使用的算符。  gear* (使用截词符“*”) “vehicle gear” (使用词组算符)  vehicle near gear (使用位置算符“near”) (car or truck) and gear (逻辑与和逻辑或混合运算,同时使用了优先算符) ((car or truck) and gear) wn ti (在题目字段中做逻辑与和逻辑或混合运算,同时使用了位置算符) 3.布尔逻辑表达式“energy(能源)NOT nuclear(核能)”的检索结果是什么? 检索结果:“有关能源方面”的文献信息,但不包括核能。4、写出检索式“computer *”的检索结果,至少须写出3个以上? compute computer computing computability computable computation computational computative
/
本文档为【信息检索 复习资料】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索