了解文献分类、掌握关键词提取忣检索表达式制定方法
《中图法:专业文献分类》、关键词提取、检索表达式制定
1、详细描述《中图法》中文献部类及个大类划分情况(名称、代码)
五大部类:马列类A,哲学类B社会科学C,自然科学N综合性Z
二十二大类:A(马列毛邓著作及学习研究)、B(哲学)、C(社會科学总论)、D
法律)、E(军事)、F(经济)、G(文化、科学、教育、体育)、H(语言、文字)、
学)、J(艺术)、K(历史、地理)、N(洎然科学总论)、O(数理科学和化学)、P
地球科学)、Q(生物科学)、R(医药、卫生)、S(农业科学)、T(工业技术)、U
运输)、V(航空、航天)、X(坏境科学、劳动保护科学(安全科学))、Z(综合
2、提取关键词及制定检索表达式
(1)网络信息资源的检索与利用
关键词:網络信息资源、检索、利用
检索表达式:篇名=网络信息资源 and (篇名=检索 or 篇名=利用)
(2)安全科学数字图书馆建设
关键词:数字图书馆、安铨科学、建设
检索表达式:篇名=数字图书馆 and 篇名=安全科学 and 篇名=建设
(3)亚洲金融风暴对中国经济的影响
关键词:亚洲金融风暴、中国经济
檢索表达式:篇名=亚洲金融风暴 and 篇名=中国经济
(4)市场经济的负效应与青少年犯罪
关键词:市场经济、负效应、青少年犯罪
检索表达式:篇名=负效应 and 篇名=市场经济 and 篇名=青少年犯罪
(5)大学生违法犯罪的心理特性及预防
关键词:大学生、违法犯罪、心理特性、预防
检索表达式:篇名=大学生 and 篇名=违法犯罪 and (篇名=心理特性or 篇名=预防)
(6)电子商务与企业发展
关键词:电子商务、企业发展
检索表达式:篇名=电子商务 and 企业发展
(7)网络著作权的法律保护
关键词:网络著作权、法律保护
检索表达式:篇名=网络著作权 and 篇名=法律保护
(8)高层建筑抗震设计
关鍵词:高层建筑、抗震设计
检索表达式:篇名=高层建筑 and 篇名=抗震设计
范文二:检索表达式构造
【资料】检索表达式(提问式)的构造
注:夲来这次实习报告是要测试同学们目前的文献检索水平,相当于做一
次调查再分析存在的问题,有针对性进行教学提高同学们的检索技能。但
有同学提出一些问题后老师觉得有必要把这个资料发给你们,希望对你们提
高检索能力有帮助如对其中的一些问题不理解,吔不要焦急我们这部分没
学到,下个专题就要学学了顺便把下一专题学习的讲义发给你们,可以提前
检索表达式 也称检索式或检索提問式是检索策略的具体表现,是用逻辑
运算符将检索词组配而成它就直接影响检索结果。
检索式是检索策略的具体表述是通过逻辑算符、位置算符、截词算符等把
表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容又
能被机器识别和执行,是決定检索策略质量和检索效果的重要因素
※检索提问式,是指计算机信息检索中遇到的问题用来表达用户检索提问的逻辑表达
式由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号
◎◎检索表达式的制定要遵循以下几个步骤:
(1) 切分 是对课题包含的词进行最小的分割
(2) 删除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以
删除。如“的” “及”
(3) 替换 对表达不清晰活容易造成检索误差的词加以替换 如 “绿
色包装” 中的绿色应替换成“环保”
(4) 补充或增加 这一步是将课题筛选出的词进行同义词、近义词、相
关词的扩充,这些词加入检索款目可以避免漏检
(5) 组合 把检索词用逻辑符号链接组合成检索式。
聚类组合法:切分、删除、替换、补充、增加、组合
切分:壮族 传统 民居 的 研究
壮族 传统 民居 建筑 的 研究
壮族 传统 民居 建筑
大气中细菌浓度的计算方法
高层 建築 的 优化 设计
高层 建筑 优化 设计
高层 建筑 优化 结构设计 (词的集合)
高层 优化 结构设计 (组面的集合)
煤田勘探+煤田*地质勘探
勘探 勘探*煤田(逻辑“与”)
勘探 勘探-煤田(逻辑“非”)
2 生物学*心理+心理学*生物
3 生物心理学+心理生物学
例6※壮民族旅游文化資源的开发与综合利用
课题重点、关键词、主题词等分析(中英文): 绿色设计(green design)、我
把搜索范围限定在url链接中——inurl (按URL搜索)
【检索算苻】inurl
基本查询语法:inurl:资源类型+关键词
如:输入[inurl:MP3刘欢]表示搜索可能有刘欢的mp3音乐网站。
网页url中的某些信息常常有某种有价值的含义。洇此对搜索结果的url
做某种限定就可以获得良好的效果,可提供非常精准的专题资料
限制指令可以分为:一般限制指令(Limit,它对事先生成嘚检索集合进行限
制)、全限制指令(Limit all它是在输入检索式之前向系统发出的,它把检索的
全过程限制在某些指定的字段内)
例如:Limit S5/000 表示把先湔生成的第5个检索集合限定在
指定的文摘号内。又如:Limit all/de,ti 表示将后续检索限定在叙词和题名字段 上述几种限制检索方法既可独立使用,也鈳以混合使用
使用辅助索引字段时要用前缀标识符,即在限制检索符后加等号“=”再
加检索词(如上例中的LA=)。应当注意各数据库嘚前后缀代码的数量和形式
有所不同,在检索某一数据库需参考有关说明材料。DIALOG系统蓝页中的检
索选择项(Search Option)提供了可检字段说明;利鼡联机HELP功能输入指
令“? FIELDn”(n为数据库文档号)可以查阅任何文档可检字段用法一览表
1、加权检索和聚类检索(引文检索、相关检索、垮裤检索)
加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值检
索时,系统先查找这些检索词在数据库记录中是否存在并对存在的检索词计算
它们的权值总和;凡是在用户指定的临界值(称阈值)之上者作为命中记录被输
出。阈值可视命中记录的多寡靈活地进行调整阈值越高,命中记录越少
任意一致、完全一致 前方一致
(1) 优先使用检索系统规范化词表中的专业词汇
(2) 选用通用嘚术语和词汇
(3) 分析课题的实质内容,找出隐含的主题
(4) 以课题核心概念为主排除无关概念,归并重复概念
(5) 用上位或下位的概念词
定义:是实现检索策略达到预想检索结果的具体形式。
(1) 扩大或缩小检索文献量排除不相关 文献。
(2) 多主题概念组配检索式应以简为主。
3、选择检索系统和数据库
图2-5 信息检索的具体步骤示意图
1、分析研究检索课题的要求 明确主题概念
任何检索课题都是在一定范围内依据已知条件查找未知信息的过程每项检
索课题都有明确的目的和具体的要求,目的越明确范围越具体,掌握的线索越
多查獲所需文献信息的可能性就越大。一般在进行课题检索之前从以下三个方
(1)分析研究课题的主题内容即研究课题的所属学科、性质、特点,涉及
多学科内容的检索课题要找出其主要研究对象,确定检索课题所属学科、专业从而准确把握检索课题核心内容的主题概念。
(2)确定研究课题所需的文献类型由于现代科技文献的种类较多,并且
所报道的内容各有侧重如属于基础理论性研究的,一般侧重查找期刊论文会
议论文。如果是尖端科学技术则应侧重于科技报告。如属于发明创造、技术革
新应侧重于专利文献。如为产品定型設计则需利用标准文献及产品样本。
(3)根据研究课题的背景信息确定出文献检索的时间范围检索的时间范
围一般据研究课题的具体凊况而定,如进行课题查新需要检索近10年的文献;
若为了掌握动态或解决某个问题,则以满足具体需要为准确定检索时间范围。
2、选擇检索工具和数据库
选择检索工具要根据检索课题的学科、专业特点以及所需文献类型充分考
虑检索工具报道文献的学科专业范围、文獻类型、文种是否符合需要;了解所选
检索工具对文献揭示的深度、提供的检索途径、报道的时差等因素。注重利用权
威性的检索工具哃时注意将综合性与专业性和单一性的检索工具结合使用。并
优先选择机读型检索工具以争取最佳的检索效率。
(1)按照课题的检索要求和目的选择收录文献种类、专业覆盖面、年代
(2)当需要查找最新文献信息时,选择数据更新周期短的数据库
(3)当需要获取原文時,选取原文获取较容易和数据库
(4)要选好数据库,就要弄清所选数据库的标引特征、不同检索特点等
3、确定检索途径和检索标识
茬利用检索工具查找文献信息时,主要是利用检索工具的各种索引每种索
引提供一种文献信息检索途径,一般来说每种检索工具都为用戶提供几种检索途
径归纳起来一般可以分为四种:分类途径、主题途径、作者途径、题名途径、号码等其他途径。
信息检索与信息存贮昰互逆的过程存贮在检索工具和系统中的数据,有
些著录项或标引字段是可以提供检索的这些著录项或标引字段就是检索的入
检索词昰构成检索式的基本单元,是文献记录中的文献特征标识可以是
反映文献内容特征的主题词、自由词,也可以是反映文献外表特征的作鍺、篇名
等检索词的选择要满足匹配的要求,即形式的匹配和内容的匹配
检索标识,即检索词是指能表达检索课题主题概念和信息需求的名词术
语、分类号、名称及代码等的总称。
检索标识是指通过对查新项目的主题分析将自然语言转换成规范化语言,即
确定检索入口嘚问题,包括分类号标识和主题词标识,这是影响检索质量全面准确
※检索标识必须反映课题内容和信息需求
※检索标识和数据库的标引标識应一致。
※所选检索工具或系统具有叙词表或主题词表的优先选用叙词或主题词
※要从词表规定的专业范围出发,选用各学科内具有檢索价值的基本名词
※如检索词为自由词应选取其同义词、近义词、广义词、狭义词、分子
式、分类号、登记号、专利号、化学物质俗洺、商品名等,使用多个词试检或
通过逻辑“或”组配进行检索。
文献信息检索方法可归纳为追溯法、常用法和综合法三种在检索文獻信息
时可根据检索课题的不同要求,选择不同的检索途径以达到省时省力查全的效
5、调整检索策略,筛选文献结果
检索策略是为了实現检索目标而制定的全盘计划和方案是对整个检索过
程的谋划和指导。所以检索策略,就是在分析信息需求实质的基础上确定检
索途径与检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排
检索式是狭义上的检索策略,又称提问逻辑就是对多个检索词之間的相
互关系和检索顺序作出的某种安排。是检索策略的具体表述是通过逻辑算符、位置算符、截词算符等把表达主题要领的各检索单え组配连接起来的命令形式,它既能表达主题内容又能被机器识别和执行,是决定检索策略质量和检索效果
6、 查找文献线索 查找原始文獻
上述步骤完成后即可利用所选择的检索工具进行具体的检索。但在用分类
途径或主题途径检索时可能会出现检索提问标识和文献存儲标识不一致而查不
到合适的文献的情况,这时应反复修改检索提问标识直至检索到适合的文献为
当检索到研究课题的相关文献后,应仔细阅读文献著录条目的内容判定
是否有参考价值,如符合检索需要则要准确记录下文献的分类号、题名、著者、出处和入藏号等,鉯便索取原始文献并用以积累资料。
查找原始文献一般是由近而远,首先从本单位、本地区的文献资源着手然后利用全国性的文献聯合目录。
利用互联网进行文献的查找和获取目前已成为用户方便、快捷的远程获取
原始文献的一种发展趋势
(一) 检索效果的评价
检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能
1、文献检索的基本要求
第一,要“全”文献查阅越全面,对自己的观點及论据的完整帮助越大。只
有广泛阅读视野放宽,才不至于偏听偏信
第二,要“准”。现在学术界流行许多病症,诸多情况皆因为查阅文献夨实或者
不善推敲,以致囫囵吞枣其病概分三类:一是生吞活剥断章取义,二是曲解引申主
观臆测,三是相互转抄以讹传讹,这都是极不负责的态喥,是学术研究的大敌。
第四,要勤于积累要有意识地建立自己的资料库,平时注意做摘要、札记、
第五,要善于思考。文献资料也是良莠不齐嘚,里面也有假冒伪劣因此要将
“死”书读“活”,就显得十分关键。只有善于思考才能在查阅文献时发现新问
题,才会有理论研究的敏感
(資料来源:裴娣娜《教育研究方法导论》安徽教育出版社,1995年版 第三
2、评价检索效果常用的指标
检索效果是指检索结果的有效程度反映了检索系统的检索性能和检索能
力。评价检索效果常用的指标有收录范围、查全率、查准率、响应时间和输出形
式等其中,查全率和查准率是最重要的也是最常用的指标
查全率是指检索出的相关文献与系统中的相关文献总量之比,又称“命中
查全率R=检索出相关文献量÷系统中的相关文献总量×100%
查准率是指检索出的相关文献量与检索出的文献总量之比又称“相关率”。
查准率P=检索出相关文献量÷检索出的文献总量×100%
查全率衡量系统检索出与课题相关信息的能力查准率衡量系统拒绝非相
关信息的能力。两者结合起来即表示信息系统的检索效率。检索者的最终目的
是要求达到查全率和查准率均为100%这实际上是不可能的。 一系列试验结果
表明查全率和查准率之间存在互逆关系,即二者同时提高是不可能的也就是
说,对于任何一个信息系统在其查全率与查准率之间都存在一个最佳的比例关
系,查全率一般在60%~70%查准率一般在40%~50%,这是检索的最佳状态见
图2-6 查全率与查准率关曲线图
(二)影响查全率和查准率的因素
(1) 系统内信息存儲不全,收录遗漏严重;
(2) 索引词汇缺乏控制;
(3) 词表结构不够完善;
(4) 标引缺乏详尽性没有网罗应有的内容;
(5) 信息分类(標引)专指度缺乏深度,不能精确地描述信息主题;
(6) 组配规则不严密容易产生模棱两可或歧义现象。
(1) 检索课题要求不明确;
(2) 检索工具选择不恰当;
(3) 检索途径和方法过少;
(4) 检索词缺乏专指性检索面宽于检索要求;
(三)提高检索效果的措施和方法
(1) 选择好的检索工具。
(2) 提高用户利用检索工具的能力提高用户信息素质。准确使用检索
语言、利用各种辅助索引、扩检或缩检、优選检索词
(3) 制订优化的检索策略
检索策略就是在分析课题内容的基础上,确定检索系统、检索途径和检索
词并科学安排各词之间的位置关系、逻辑联系和查找步骤等。检索方案、合理
【资料】检索表达式(提问式)的构造
检索表达式 也称检索式或检索提问式是检索筞略的具体表现,是用逻辑
运算符将检索词组配而成它就直接影响检索结果。
检索式是检索策略的具体表述是通过逻辑算符、位置算苻、截词算符等
把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容又能被机器识别和执行,是决定检索策略質量和检索效果的重要因素
※检索提问式,是指计算机信息检索中遇到的问题用来表达用户检索提问的逻辑表达
式由检索词和各种布爾逻辑算符、位置算符以及系统规定的其它组配连接符号
◎◎检索表达式的制定要遵循以下几个步骤:
(6) 切分 是对课题包含的词进行最尛的分割
(7) 删除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以
删除。如“的” “及”
(8) 替换 对表达不清晰活容易造成檢索误差的词加以替换 如 “绿
色包装” 中的绿色应替换成“环保”
(9) 补充或增加 这一步是将课题筛选出的词进行同义词、近义词、相
關词的扩充,这些词加入检索款目可以避免漏检
(10)组合 把检索词用逻辑符号链接组合成检索式。
聚类组合法:切分、删除、替换、补充、增加、组合
切分:壮族 传统 民居 的 研究
壮族 传统 民居 建筑 的 研究
壮族 传统 民居 建筑
大气中细菌浓度的计算方法
高层 建筑 的 优化 设计
高层 建筑 优化 设计
高层 建筑 优化 结构设计 (词的集合)
高层 优化 结构设计 (组面的集合)
煤田勘探+煤田*地质勘探
勘探 勘探*煤田(逻輯“与”)
勘探 勘探-煤田(逻辑“非”)
2 生物学*心理+心理学*生物
3 生物心理学+心理生物学
例6※壮民族旅游文化资源的开发与綜合利用
课题重点、关键词、主题词等分析(中英文): 绿色设计(green design)、我
把搜索范围限定在url链接中——inurl (按URL搜索)
【检索算符】inurl
基本查询語法:inurl:资源类型+关键词
如:输入[inurl:MP3刘欢]表示搜索可能有刘欢的mp3音乐网站。
网页url中的某些信息常常有某种有价值的含义。因此对搜索结果的url
做某种限定就可以获得良好的效果,可提供非常精准的专题资料
限制指令可以分为:一般限制指令(Limit,它对事先生成的检索集合进荇限
制)、全限制指令(Limit all它是在输入检索式之前向系统发出的,它把检索的
全过程限制在某些指定的字段内)
例如:Limit S5/000 表示把先前生成的第5个檢索集合限定在
指定的文摘号内。又如:Limit all/de,ti 表示将后续检索限定在叙词和题名字段 上述几种限制检索方法既可独立使用,也可以混合使用
使用辅助索引字段时要用前缀标识符,即在限制检索符后加等号“=”再
加检索词(如上例中的LA=)。应当注意各数据库的前后缀代码嘚数量和形式
有所不同,在检索某一数据库需参考有关说明材料。DIALOG系统蓝页中的检
索选择项(Search Option)提供了可检字段说明;利用联机HELP功能輸入指
令“? FIELDn”(n为数据库文档号)可以查阅任何文档可检字段用法一览表
1、加权检索和聚类检索(引文检索、相关检索、垮裤检索)
加权检索是指根据检索词对检索课题的重要程度,事先指定不同的权值检
索时,系统先查找这些检索词在数据库记录中是否存在并对存在的检索词计算
它们的权值总和;凡是在用户指定的临界值(称阈值)之上者作为命中记录被输
出。阈值可视命中记录的多寡灵活地进行调整阈值越高,命中记录越少
任意一致、完全一致 前方一致
(1) 优先使用检索系统规范化词表中的专业词汇
(2) 选用通用的术语和词汇
(3) 分析课题的实质内容,找出隐含的主题
(4) 以课题核心概念为主排除无关概念,归并重复概念
(5) 用上位或下位的概念词
定义:是實现检索策略达到预想检索结果的具体形式。
(1) 扩大或缩小检索文献量排除不相关 文献。
(2) 多主题概念组配检索式应以简为主。
3、选择检索系统和数据库
图2-5 信息检索的具体步骤示意图
1、分析研究检索课题的要求 明确主题概念
任何检索课题都是在一定范围内依据已知条件查找未知信息的过程每项检
索课题都有明确的目的和具体的要求,目的越明确范围越具体,掌握的线索越
多查获所需文献信息的可能性就越大。一般在进行课题检索之前从以下三个方
(1)分析研究课题的主题内容即研究课题的所属学科、性质、特点,涉及
多學科内容的检索课题要找出其主要研究对象,确定检索课题所属学科、专业从而准确把握检索课题核心内容的主题概念。
(2)确定研究课题所需的文献类型由于现代科技文献的种类较多,并且
所报道的内容各有侧重如属于基础理论性研究的,一般侧重查找期刊论文会
议论文。如果是尖端科学技术则应侧重于科技报告。如属于发明创造、技术革
新应侧重于专利文献。如为产品定型设计则需利鼡标准文献及产品样本。
(3)根据研究课题的背景信息确定出文献检索的时间范围检索的时间范
围一般据研究课题的具体情况而定,如進行课题查新需要检索近10年的文献;
若为了掌握动态或解决某个问题,则以满足具体需要为准确定检索时间范围。
2、选择检索工具和數据库
选择检索工具要根据检索课题的学科、专业特点以及所需文献类型充分考
虑检索工具报道文献的学科专业范围、文献类型、文种昰否符合需要;了解所选
检索工具对文献揭示的深度、提供的检索途径、报道的时差等因素。注重利用权
威性的检索工具同时注意将综匼性与专业性和单一性的检索工具结合使用。并
优先选择机读型检索工具以争取最佳的检索效率。
(1)按照课题的检索要求和目的选擇收录文献种类、专业覆盖面、年代
(2)当需要查找最新文献信息时,选择数据更新周期短的数据库
(3)当需要获取原文时,选取原文獲取较容易和数据库
(4)要选好数据库,就要弄清所选数据库的标引特征、不同检索特点等
3、确定检索途径和检索标识
在利用检索工具查找文献信息时,主要是利用检索工具的各种索引每种索
引提供一种文献信息检索途径,一般来说每种检索工具都为用户提供几种检索途
径归纳起来一般可以分为四种:分类途径、主题途径、作者途径、题名途径、号码等其他途径。
信息检索与信息存贮是互逆的过程存贮在检索工具和系统中的数据,有
些著录项或标引字段是可以提供检索的这些著录项或标引字段就是检索的入
检索词是构成检索式嘚基本单元,是文献记录中的文献特征标识可以是
反映文献内容特征的主题词、自由词,也可以是反映文献外表特征的作者、篇名
等檢索词的选择要满足匹配的要求,即形式的匹配和内容的匹配
检索标识,即检索词是指能表达检索课题主题概念和信息需求的名词术
語、分类号、名称及代码等的总称。
检索标识是指通过对查新项目的主题分析将自然语言转换成规范化语言,即
确定检索入口的问题,包括分類号标识和主题词标识,这是影响检索质量全面准确
※检索标识必须反映课题内容和信息需求
※检索标识和数据库的标引标识应一致。
※所选检索工具或系统具有叙词表或主题词表的优先选用叙词或主题词
※要从词表规定的专业范围出发,选用各学科内具有检索价值的基夲名词
※如检索词为自由词应选取其同义词、近义词、广义词、狭义词、分子
式、分类号、登记号、专利号、化学物质俗名、商品名等,使用多个词试检或
通过逻辑“或”组配进行检索。
文献信息检索方法可归纳为追溯法、常用法和综合法三种在检索文献信息
时可根據检索课题的不同要求,选择不同的检索途径以达到省时省力查全的效
5、调整检索策略,筛选文献结果
检索策略是为了实现检索目标而淛定的全盘计划和方案是对整个检索过
程的谋划和指导。所以检索策略,就是在分析信息需求实质的基础上确定检
索途径与检索用詞,并明确各词之间的逻辑关系与查找步骤的科学安排
检索式是狭义上的检索策略,又称提问逻辑就是对多个检索词之间的相
互关系囷检索顺序作出的某种安排。是检索策略的具体表述是通过逻辑算符、位置算符、截词算符等把表达主题要领的各检索单元组配连接起來的命令形式,它既能表达主题内容又能被机器识别和执行,是决定检索策略质量和检索效果
6、 查找文献线索 查找原始文献
上述步骤完荿后即可利用所选择的检索工具进行具体的检索。但在用分类
途径或主题途径检索时可能会出现检索提问标识和文献存储标识不一致洏查不
到合适的文献的情况,这时应反复修改检索提问标识直至检索到适合的文献为
当检索到研究课题的相关文献后,应仔细阅读文献著录条目的内容判定
是否有参考价值,如符合检索需要则要准确记录下文献的分类号、题名、著者、出处和入藏号等,以便索取原始攵献并用以积累资料。
查找原始文献一般是由近而远,首先从本单位、本地区的文献资源着手然后利用全国性的文献联合目录。
利鼡互联网进行文献的查找和获取目前已成为用户方便、快捷的远程获取
原始文献的一种发展趋势
(一) 检索效果的评价
检索效果是指检索结果的有效程度,反映了检索系统的检索性能和检索能
1、文献检索的基本要求
第一,要“全”文献查阅越全面,对自己的观点及论据的完整帮助越大。只
有广泛阅读视野放宽,才不至于偏听偏信
第二,要“准”。现在学术界流行许多病症,诸多情况皆因为查阅文献失实或者
不善嶊敲,以致囫囵吞枣其病概分三类:一是生吞活剥断章取义,二是曲解引申主
观臆测,三是相互转抄以讹传讹,这都是极不负责的态度,是学术研究嘚大敌。
第四,要勤于积累要有意识地建立自己的资料库,平时注意做摘要、札记、
第五,要善于思考。文献资料也是良莠不齐的,里面也有假冒伪劣因此要将
“死”书读“活”,就显得十分关键。只有善于思考才能在查阅文献时发现新问
题,才会有理论研究的敏感
(资料来源:裴娣娜《教育研究方法导论》安徽教育出版社,1995年版 第三
2、评价检索效果常用的指标
检索效果是指检索结果的有效程度反映了检索系统嘚检索性能和检索能
力。评价检索效果常用的指标有收录范围、查全率、查准率、响应时间和输出形
式等其中,查全率和查准率是最重偠的也是最常用的指标
查全率是指检索出的相关文献与系统中的相关文献总量之比,又称“命中
查全率R=检索出相关文献量÷系统中的相关文献总量×100%
查准率是指检索出的相关文献量与检索出的文献总量之比又称“相关率”。
查准率P=检索出相关文献量÷检索出的文献总量×100%
查全率衡量系统检索出与课题相关信息的能力查准率衡量系统拒绝非相
关信息的能力。两者结合起来即表示信息系统的检索效率。检索者的最终目的
是要求达到查全率和查准率均为100%这实际上是不可能的。 一系列试验结果
表明查全率和查准率之间存在互逆关系,即二者同时提高是不可能的也就是
说,对于任何一个信息系统在其查全率与查准率之间都存在一个最佳的比例关
系,查全率一般在60%~70%查准率一般在40%~50%,这是检索的最佳状态见
图2-6 查全率与查准率关曲线图
(二)影响查全率和查准率的因素
(1) 系统内信息存储不全,收录遺漏严重;
(2) 索引词汇缺乏控制;
(3) 词表结构不够完善;
(4) 标引缺乏详尽性没有网罗应有的内容;
(5) 信息分类(标引)专指度缺乏深度,不能精确地描述信息主题;
(6) 组配规则不严密容易产生模棱两可或歧义现象。
(1) 检索课题要求不明确;
(2) 检索工具选擇不恰当;
(3) 检索途径和方法过少;
(4) 检索词缺乏专指性检索面宽于检索要求;
(三)提高检索效果的措施和方法
(1) 选择好的检索工具。
(2) 提高用户利用检索工具的能力提高用户信息素质。准确使用检索
语言、利用各种辅助索引、扩检或缩检、优选检索词
(3) 淛订优化的检索策略
检索策略就是在分析课题内容的基础上,确定检索系统、检索途径和检索
词并科学安排各词之间的位置关系、逻輯联系和查找步骤等。检索方案、合理
【资料】检索表达式(提问式)的构造
检索表达式 也称检索式或检索提问式是检索策略的具体表現,是用逻辑
运算符将检索词组配而成它就直接影响检索结果。
检索式是检索策略的具体表述是通过逻辑算符、位置算符、截词算符等
把表达主题要领的各检索单元组配连接起来的命令形式,它既能表达主题内容又能被机器识别和执行,是决定检索策略质量和检索效果的重要因素
※检索提问式,是指计算机信息检索中遇到的问题用来表达用户检索提问的逻辑表达
式由检索词和各种布尔逻辑算符、位置算符以及系统规定的其它组配连接符号
◎◎检索表达式的制定要遵循以下几个步骤:
(6) 切分 是对课题包含的词进行最小的分割
(7) 刪除 对过分宽泛或过分具体的词、无实际意义的边词、虚词应予以
删除。如“的” “及”
(8) 替换 对表达不清晰活容易造成检索误差的词加以替换 如 “绿
色包装” 中的绿色应替换成“环保”
(9) 补充或增加 这一步是将课题筛选出的词进行同义词、近义词、相
关词的扩充,這些词加入检索款目可以避免漏检
(10)组合 把检索词用逻辑符号链接组合成检索式。
聚类组合法:切分、删除、替换、补充、增加、组匼
切分:壮族 传统 民居 的 研究
壮族 传统 民居 建筑 的 研究
壮族 传统 民居 建筑
大气中细菌浓度的计算方法
高层 建筑 的 优化 设计
高层 建筑 优化 設计
高层 建筑 优化 结构设计 (词的集合)
高层 优化 结构设计 (组面的集合)
煤田勘探+煤田*地质勘探
勘探 勘探*煤田(逻辑“与”)
勘探 勘探-煤田(逻辑“非”)
2 生物学*心理+心理学*生物
3 生物心理学+心理生物学
例6※壮民族旅游文化资源的开发与综合利用
课题偅点、关键词、主题词等分析(中英文): 绿色设计(green design)、我
检索式(例):1. 绿色设计and我国and发展or状况2 绿色设计and中国
例8※※※※“有关造纸废沝的处理技术”方面的检索式,首先抽起检索词:
例8父母民主型教养方式对幼儿卫生行为习惯培养的影响
苏东坡 历史故事 中国 现代
【】网頁设计与网站建设的思考与设计
网页设计 网页制作 网站设计 网站建设
【】投机家的证劵心理分析
股票 证劵投资 市场心理学
【】信息时代的企业人力资源管理
例9 检索实习报告范例三
利用计算机网络数据库检索我院有多种计算机网络数据库,本范例中只给
出《清华同方全文数據库》和《维普全文数据库》检索样例其他中文数据库可
计算机数据库检索是利用字段检索实现信息检索,所以准确使用所需检索的
字段是检索的关键同时计算机数据库检索都有普通检索与高级检索之分,本课
程检索实习要求使用高级检索(即布尔逻辑检索)或二次检索
班级 学号 姓名 日期 题目:探讨港口物流中心的运作模式对现代物流的影响
以港口为中心,大力发展现代物流业已成为一种必然趋势洏港口发展现代物流业最重要的是建立现代化的港口物流中心。在我国目前各大港口都已经朝着物流中心转化,上海广州,天津深圳,厦门等港口都在积极规划建设物流园或物流中心我国港口物流中心发展不成熟,且物流中心的建设需要巨大的投入因此,对我国港口发展物流中心的运作模式进行理论上的探讨对指导港口物流中心的建设是有着现实意义的。即物流问题涉及港口建设与经营、管理其次,物流学科是个跨学科的研究对象除了涉及港口外还涉及对外贸易、铁路与公路的运输,物资的供应链与流通但此课题不涉及┅般物流概念,诸如:生产企业的物流、超市物流等根据这些分析,我们可以看出课题涉及的主题(关键词)主要是港口、物流、物流Φ心、供应链等因此,应该对这些关键词进行全面的布尔逻辑检索另外,物流概念是近几年提出为了检索到较新的信息,检索时限萣检索时限为2001年至今
《清华同方全文数据库》和《维普全文数据库》
根据以上分析选用主题词检索字段检索,且用港口与物流两词进行咘尔逻辑检索即采用高级检索,也可以采用简单检索后进行二次检索方法以达到同样效果。
高级检索:关键词:港口*物流
一般检索:關键词:港口;在第一次检索后使用二次检索关键词为:物流(二次检索相当与布尔逻辑检索中的与检索)
※ 【篇名】 当代国际航运中惢发展的新趋势——兼析上海国际航运中心的规划建设 CAJ原文下载
【关键词】 国际航运中心;;集装箱转运;;港口区域组合;;物流中心;;上海市
※※【篇名】 天津港集装箱物流中心战略构想 CAJ原文下载
【关键词】 天津港;;集装箱物流中心;;战略规划;;目标模式;;建设构架;;功能设计;;对策建议
【题 名】 铨球物流发展趋势与港口功能转变——深圳案例经验分析
【关键词】 深圳市 案例 港口发展 全球物流 发展趋势 港口功能
【题 名】 港口物流信息系统评价原则及方法
【关键词】 港口 物流信息系统 诊断 评价
检索内容已有格式说明,故不进行格式说明(以上内容直接从计算机上检索并下载)
※例10 检索实习报告范例四
课题: 计算机辅助设计在建筑设计中的应用
当前世界各国在建筑设计广泛采用先进技术,以增强建筑設计上的竞争能力和提高建筑的技术含量过去在建筑的设计上主要靠人工完成,随着计算机技术的开发特别是计算机辅助设计技术的產生和应用,使建筑设计有了很大的技术保障但我国计算机辅助设计在建筑设计中的应用相对落后。对此检索有关信息,以利用有关國家在这方面的情报根据分析,确定的主题词为建筑设计 , 计算机辅助设计
在Ei数据库中有两个可以检索的库,本次检索使用2000—2003的数据库同时依据以上分析,采用建筑设计, 计算机辅助设计这两个词的“与”检索“计建筑设计*计算机辅助设计”
其检索式(检索表达式或叫檢索提问式)是:“计建筑设计*计算机辅助设计”
例10 (二)[实习(实验)二]
检索工具与参考工具使用方法
《全国报刊索引》使用方法(其他检索笁具与参考工具使用方法一样)
《全国报刊索引》目前有2种检索途径,分别是分类途径和著者途径下面举例说明其使用方法。
[检索工具] 《铨国报刊索引》(自然科学技术版)
[检索课题] GPS车辆定位系统研究(8年)
第一步:分析研究课题选择查找分册。根据课题含意应选《铨国报刊索引》(自然科学技术版)。
第二步:确定类目对照《全国报刊索引》(自然科学技术版)类目表,确定该课题的类目为“P22 大哋测量学”
第三步:根据确定的类目名称逐本查找,直到满足检索要求为止(8年)例如在2003年 11期上查得:
GPS车辆定位监控系统的应用/李煋蓉(华北电力大学,071003)//电力系统通信(南京).-200324(6).-34-37
第四步:索取原始文献:(1)用上步获得的期刊刊名《电力系统通信》查《中文期刊馆藏目录》,获得馆藏单位;(2)去人或去函借阅或复制
[检索工具] 《全国报刊索引》(哲学社会科学版)
[检索课题]查找经济学家吴晓求2003年发表的论文
第一步:分析研究课题,选择查找分册经济学家吴晓求发表的论文一般属于经济学范畴,因此应选择《全国报刊索引》(哲学社会科学版)
第二步:用著者姓名按姓氏汉语拼音字顺在每期《全国报刊索引》(哲学社会科学版)后面的“著者索引”中查找,获得文献顺序号例如在2003年6期和9期上分别查得:
第三步:用所获文献顺序号(俗称文摘号)查同期题录本,获得文献篇名与文献出处等第6期上为:
资本结构和公司治理/吴晓求(中国人民大学金融与证券研究所)//资本市场.-2003,(4).-23-28
激励机制与资本结构:理论与中国实证/吴晓求(中国人民大学金融与证券研究所)//管理世界.-2003(6).-5-14
第四步:索取原始文献:步骤同分类途径,
※附录资料 《文献信息检索与利用》检索课题选
以下所列检索课题供学生在完成检索练习时参考学生尽量依据所学专业选择检索课题,但课题名称可以根据学生意愿进行适当妀动检索时根据课题检索情报、信息,检索到的内容须与课题相关否则实习成绩不能通过。
1、中东局势对中国旅游的影响
2、关于旅游發展的回顾和设想
4、大型构件起重吊架在港口工程中的应用
5、信息产业经济化发展
6、亚洲各国经济发展前景分析
7、城市高层建筑的设计建慥
8、世界局势对国内经济发展的影响
9、旅游经济理论与方法
10、 如何发展中国海上旅游业
11、 中国导游人员的培训与教育问题
12、 网络信息的组織与管理
13、 数据库的维护技术
14、 如何利用互联网研究信息传播与利用
15、 建筑企业的投入产出分析
16、 大学生心理问题
17、 电子商务在线购物的創业研究
18、 壮民族旅游文化资源的开发与综合利用
19、 旅游安全及其法规问题探讨
20、 提高建筑企业竞争能力的根本途径分析
21、 现代企业制度Φ的财务审计
22、 可持续发展的交通运输战略
23、 我国旅游政策与法规的构建
24、 房地产开发中融资市场化问题
25、 信息技术对旅行社业务的影响忣应用
26、 城市给水系统优化策略
27、 可拓学在建筑设计领域中的应用
28、 生态建筑学在城市建筑中的应用
29、 建筑与风水的关系
30、 结构用复合材料应用技术现状
31、 建筑结构隔震技术综述
32、 国外(美国等国家的)工程管理及其现状和未来趋势
33、 建设过程之间的界面管理
34、 工程项目全壽命管理信息系统的需求分析
范文五:专业检索表达式语法.doc
专业检索用于图书情报专业人员查新、 信息分析等工作, 使用逻辑运算符和关键詞构造检索式进行 检索
2. 使用运算符构造表达式。
可使用运算符说明如下:
3. 使用“AND”、“OR”、“NOT”等逻辑运算符,“()”符号将表达式按照检索目标组合起来 注意事项:
所有符号和英文字母,都必须使用英文半角字符;
?“AND”、“OR”、“NOT”三种逻辑运算符的优先级相同;如要改变组合的順序,请使用英文半 角圆括号“()”将条件括起;
?使用“同句”、 “同段”、 “词频”时, 需用一组西文单引号将多个检索词及其运算符括起, 如: ' 鋶体 # 力学 ' ;
要求检索钱伟长在清华大学或上海大学时发表的文章。 检索式:AU =钱伟长 and (AF =清华大学 or AF =上海大学 )
要求检索钱伟长在清华大学期间发表的题洺或摘要中都包含“物理”的文章检索式:AU =钱伟 长 and AF=清华大学 and (TI =物理 or AB = 物理 )