杂志信息网-创作、查重、发刊有保障。

毕业论文检索与搜集

发布时间:2024-07-07 17:48:11

毕业论文检索与搜集

如何进行论文检索我是学自然科学的,平时确实需要不少外文文献,对于自然科学来讲英文文献检索首推Elsevier,Springer等。虽然这些数据库里面文献已经不算少了。但是有时还会碰到查不到的文献,而这些文献的数据库我们所在研究所或大学又没有买,怎么办?我基本通过以下向个途径来得到文献。1.首先在Google 学术搜索里进行搜索,里面一般会搜出来你要找的文献,在Google学术搜索里通常情况会出现“每组几个”等字样,然后进入后,分别点击,里面的其中一个就有可能会下到全文,当然这只是碰运气,不是万能的,因为我常常碰到这种情况,所以也算是得到全文文献的一条途径吧。可以试一下。2.如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 学术搜索),用作者的名字来搜索,是因为我发现很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(home page)上,这样可能也是为了让别的研究者更加了解自己的学术领域,顺便推销自己吧。这样你就有可能下到你想要的文献的全文了。甚至可以下到那个作者相近的内容的其它文章。如果文献是由多个作者写的,第一作者查不到个人主页,就接上面的方法查第二作者,以此类推。用文章的title来搜索,是因为在国外有的网站上,例如有的国外大学的图书馆可能会把本校一年或近几年的学术成果的Publication的PDF全文献挂在网上,或者在这个大学的ftp上也有可能会有这样类似的全文.这样就很可能会免费下到你想要的全文了.3.如果上面两个方法都没有查到你要的文献,那你就直接写邮件向作者要。一般情况下作者都喜欢把自己的文献给别人,因为他把这些文献给别人,也相当于在传播他自己的学术思想。下面是本人向老外作者要文献的一个常用的模板:Dear Professor ×××I am in ××× Institute of ×××, Chinese Academy of am writing to request your assistance. I search one of your papers: 。。。。。。。。。。。。。。。。。(你的文献题目)but I can not read full-text content, would you mind sending your papers by E-mail? Thank you for your wishes !(or best regards)×××本人的经验是讲英语的国家的作者给文章的机率会大,一般你要就会给,其它不讲英语的国家,如德国,法国,日本等国家的作者可能不会给。出于礼貌,如果你要的文献作者E-mail给你了,千万别忘记回信致谢.4.最后一种方法其实大家都熟悉,就是发贴在小木虫上求助。我还用另一种方法,就是直接让我所在的研究所图书馆的管理员帮我从外面的图书馆文献传递。不过有的文献可能是要钱的。一页元,由于我们看文献的钱都是由课题出,所以也就不太考虑钱的问题了。2.如何进行文献阅读其实做科研,不看文献要做好科研,可以说一点可能都没有。只有广看论文,深入学习,才能厚积薄发,写出相当当的文章出来。读文献一定不要心浮气躁,或者就是想着混个毕业。相反我们要沉下心来,大量阅读文献,在读的过程中有的文献看懂了,但是看不懂的文献也可能会居多。看懂的认真学习借鉴,看不懂的深入探索,实在不行就暂时放下,过一段时间,随着知识和能力的提高慢慢也就弄明白了一些。即使还是看不懂,但是心里知道有那么回事,为将来的继续深造做了铺垫。另外千万不要只是为看文献而看文献,我们看的目的是为了能为我们自己的科研所用,所以看的过程中一定要和你自己的数据相结合,当看完一篇文献后,要好好总结,如果用自己的数据,又该怎么样解释。还有一些牛刊物上的文章,不但要学习文章里面的知识,还要学习牛人写文章的文风。好的文章肯定会有好的文风,这些都是我们将来写文章要学习的。另外相信很多搞科研的同行会有个感觉,就是看过的文献,如果只是做做标记,划下划线,还是很容易忘记,过段时间要查询起来也费事。尤其是看过的文献有几百,上千篇时,虽然可以归类整理,但效果还是不好。我建议大家边看一篇文献时,边打开word文档,边整理文章出彩和重要的部分,然后复制过去,标上文献的标题和作者等相关信息,把每一类文献归为一组。方法操作简单,将来要查询和反复的时候会有很大帮助,尤其在写文章时,相关文献及其亮点都一目了然。这个方法积累久了,对提升写作和阅读都有很大帮助,除了这样,我还有时把一些很经典的段落或都语句翻译成中文,专门整理在一个本本上,这样不但在以后写文章时直接拿出来看,省事省时间,还能锤炼英汉互译的能力,很有利于以后你和老外交流时的口语表达。

写毕业论文的流程是选题,搜集、整理资料,撰写开题报告,撰写毕业论文,中期检查,论文查重,论文答辩。

1、选题

选题通常由教师给定题目,但是也有部分情况是学生自己拟定题目,题目确定以后教师通常会下发任务书给学生,任务书上面明确规定了学生论文论文撰写目标以及具体工作要求。

2、搜集、整理资料

任务确定以后,就要开始围绕论文题目开始搜集,最主要的搜集资料的方法就是去文献检索网站搜索(主要的文献检索网站有:中国知网、web of science等)相关论文。在搜集完资料后,对搜集到的文献做一个整理,从而确定自己的研究入手点与研究方法。

3、撰写开题报告

资料搜集整理完毕之后,便要根据整理的资料开始撰写开题报告。

4、撰写毕业论文

开题报告撰写完成之后,就要开始论文的撰写阶段,这个阶段是整个流程中最耗时的阶段,本科生通常需要花费2-6个月来进行论文撰写,而硕士生则要更长时间。在论文撰写过程中我们要根据任务书的要求来进行撰写,并且有规划的制定进度安排进行调查研究、科学设计或者实验。

5、中期检查

中期检查主要是检查学生论文进展情况,通常是由学校抽查以及导师检查两部分组成。主要检查内容是论文的完成情况。

6、论文查重

检查论文重复率主要是为了避免学术造假行为,通常本科毕业论文重复率要求为知网查重低于30%,硕士要求低于10%,具体的查重标准由学校单独制定,不同学校有不同的查重标准,每个学生只要保证自己的重复率低于学校要求重复率即可。

7、论文答辩

毕业论文答辩是整个论文流程的最后一个环节,主要是为了检查学生毕业论文的完成情况,考查学生的水平与能力,从而判断学生是否达到学校毕业要求。通过答辩,指出学生研究的不足,引导学生对自己的工作进行进一步的完善,从而提升学生整体科研能力。

论文写作中文献资料检索

在社会的各个领域,许多人都写过论文吧,借助论文可以达到探讨问题进行学术研究的目的。一篇什么样的论文才能称为优秀论文呢?下面是我收集整理的论文写作中文献资料检索,欢迎阅读与收藏。

自从有了文献便有了文献检索。当人们从中查找所需信息时,文献检索也就应运而生。只不过早期可检索的对象较少,因而检索是一个不自觉的过程。早期的文献检索主要是手工检索,人们通过“心想、手翻、眼看”的方式进行。随着社会的发展和文献量的增加,人们逐渐认识到文献检索的必要性与重要性,现代文献检索是以计算机网络技术和现代信息技术为基础,在文献检索的应用中逐渐发展起来。

一、文献检索概述

文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。现在通常理解为图书、期刊等各种出版物的总和。

文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。根据载体把其分为印刷型、缩微型、机读型和声像型。根据不同出版形式及内容,可以分为:图书、连续性出版物、特种文献。

电子文献是以数字方式将图、文、声、像等信息储存在磁、光、电介质上,通过计算机、网络或相关设备使用的记录有知识内容或艺术内容的文献信息资源,包括电子书刊、数据库、电子公告等。

文献检索,就是从文献信息集合中找出所需要的文献的过程,相当于人们通常所说的资料查寻。

二、纸质文献的检索

纸质文献的检索一般分为两种:直接检索和间接检索。直接文献检索地目的是为了获取所需要的文献。因此,有时可以直接从报刊杂志中通过浏览的方法直接获得所需文献,称之为直接检索。它具有方便、快捷的特点,适于浏览新到的书刊资料,有时是一种获得最新情报的方法,但同时又受到各种限制而漏查很多相关文献。因此,它只能作为一种辅助性的检索方法。

间接文献检索是一个利用检索工具并从中查出特定文献的过程。这一过程就称为间接检索。它可以比较系统地、全面地获得相关课题的文献信息。我们需要掌握的就是这种利用检索工具的间接检索的方法。这也是文献检索的主要方式。它大体上可以分为以下五个步骤:

(一)分析研究课题,明确检索要求:弄清楚课题的性质及学科专业范围是什么,所需的文献类型,要求的文种、年代的限定、课题的关键词等等是检索的第一步。

(二)选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具或数据库。首先必须对各种检索工具所覆盖的学科范围有清楚的了解,然后从文献的类型、文种、出版的时间等方面来考虑选用哪种检索工具最合适。

(三)确定检索策略:选用具体的检索工具后,就要考虑选择和确定检索方法,确定具体的检索点,是从分类途径还是从主题途径检索,所查找的文献要达到什么要求,选用什么检索词等,以便具体进行检索。

(四)使用检索工具:确定了具体的检索方法后,就要利用所用的检索工具,在一定的年代和文献范围内具体查找,以获得文献信息。手工检索时可以一边检索一边分析取舍,获得符合需要的文献。(五)获取原文:检索文献最终要获取原文,如果在馆藏文献中查不到,则可通过各类联合目录获得其他单位收藏的信息,再通过馆际互借等途径或方式获取原文。这样就完成了文献检索的全过程。

文献检索方法主要有三种:

(一)追溯法(亦称滚雪球法):利用著者发表的文献后所列的参考文献为线索,由近及远,进行逐一追踪的查找办法,追查原文,再从这些原文后所附的参考文献逐一检索,象滚雪球似的获得一批批相关文献的方法。它是科研人员常喜欢用的一种简便的获得文献的途径。

(二)常用法:常用法也称工具法,就是直接利用各种文献检索工具查找文献的方法。由于检索工具的种类繁多,一般应根据课题内容特点,首先利用综合性的检索工具,然后再使用专业性的检索工具,二者结合,才不致造成文献资料的漏检。常用法根据时间范围又分为顺查法、倒查法和抽查法。

(三)循环法:循环法也称分段法、交替法或综合法,这是追溯法和常用法的结合。是将追溯法和常用法结合起来交替使用,充分发挥二者的优势分期、分段地交替使用,直到获得满意的相关文献为止。实际课题的检索选用何种方法,要根据具体情况而定:一是根据课题研究的需要;二是视所能利用的检索工具和检索手段。在检索工具比较丰富的条件下,可以利用常用法;在获得针对性很强文献的条件下可利用追溯法获得相关性较强的文献;获悉研究课题出版文献较多的年代可利用抽查法。

三、电子文献的检索

随着计算机、数据库和互联网络技术的普及,电子化图书馆、文献资料网络化服务等正成为我们获取文献资料的必不可少的手段,是我们学习、工作和科研的有力助手。利用好电子文献和检索工具,掌握好网络信息的搜索方法和策略对于获取信息是必要的。

传统的图书检索手段和方法对电子信息的检索作用有限。现代文献信息均能以数字化的形式获得,如电子图书、电子期刊、学位论文、会议论文、专利文献、标准文献、声像资料、多媒体资料等。电子文献的检索途径主要有以下几种:

(一)网络目录和搜索引擎

各种各样的Internet网络文献检索工具不计其数,根据提供检索与否,有网络目录和搜索引擎之分。

网络目录是按主题的等级排列的主题类目索引,类别目录按一定的主题分类体系组织,排列方法有字母顺序法、时序法、地序法、主题法等或是各种方法综合使用。用户通过逐层浏览类别目录、逐步细化的方式来寻找合适的类别直至具体资源。

搜索引擎则强调的是它的检索功能,能提供布尔逻辑检索、短语或邻近检索、模糊检索、自然语言检索等方式查询信息。各种资源进行标引,并为检索者提供检索的工具。基于搜索引擎的检索方法接近于通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获取检索结果,并输出给用户。

(二)联机馆藏目录

网络上有许多机构提供的馆藏书目信息、中外文期刊联合目录信息。其中包括各图书馆和信息机构提供(下转第137页)

(上接第36页)的公共联机检索(OPAC)馆藏书目、地区或行业的图书馆的联合目录等。

中国国家图书馆在网上提供图书目录在线检索,有题名、责任者、出版者、关键词、标准书刊号、分类号、出版地、出版国等10个检索途径。全国高等教育文献保障体系(CALIS)提供61所高校的馆藏期刊、书目和学位论文联合查询。

(三)网络数据库

网络数据库包括综合性和专业性期刊数据库、专利数据库等信息资源。这类信息资源可分为商业性和非商业性的数据库。这些数据库由专门的信息机构或公司专业制作和维护,信息质量高,是专业领域内常用数据库。

非商业性数据库因为免费使用,用户以较低的成本可获得所需的信息,所以也有很高的吸引力。如:IBM公司的免费专利文献数据库,提供美国专利的免费检索,用户可检索到1971 年以来的美国专利说明书的内容,包括专利书目信息和专利项,浏览1974年以来的专利文献。

(四)电子出版物

由于网上信息传播速度快,越来越多的出版商注重网上报刊发行。目前国内外已有很多出版高和信息服务中介商介入电子出版行业。电子出版物有电子图书、电子期刊和电子报纸。

(五)参考工具书

网络中许多参考资料是可以免费使用的,如新格罗夫音乐与音乐家大词典、英国大不列颠百科全书、汉语词典、学校或企业名录、中国国家统计局统计资料等大型工具书已加入因特网。

文献检索和使用的工作贯穿了论文写作的全过程:我们往往是先确定写作的大致内容;其次根据这个大致内容确定文献搜集的范围;然后阅读了主要的文献后再确定研究写作的具体内容;最后根据具体内容全面检索原始文献, 搜得的文献又充实了论文写作的基础。

一、文献检索的意义

文献检索在毕业论文撰写中的重要作用文献检索就是从大量的文献中迅速、准确地查出与特定的科学研究课题有关的资料。文献检索在大学生毕业论文撰写中有着不可替代的重要作用。

1.文献检索便于继承和借鉴前人的科研成果,避免重复研究

积累、继承和借鉴前人的研究成果是科学发展的重要前提,没有继承和借鉴就不可能有创新。毕业论文选题同科研选题、立项一样,必须通过文献信息检索或查新技术掌握国内外同类研究的动态进展,从中吸收有益的启示或参考数据,掌握大量相关信息,或得到更多、更有价值的论证依据。正如英国物理学家牛顿所说的是“站在巨人的肩膀上”,是指科研要熟悉别人的劳动成果,从前人研究的`“终点”中,找出自己研究的“起点”,从前人所用的研究方法、手段中受到启发,拓宽思路,分析研究所占有的资料,提炼出正确鲜明的观点。

2.文献检索有利于节省大学生查找文献时间,提高毕业论文质量

信息时代文献资料的迅猛增长,使得文献资料的`检索困难重重。如能灵活运用文献检索的技能,缩减检索时间,即能延长论文的写作时间。同时,文献信息检索利用可为毕业论文的观点提供理论依据和支持。大学生通过对文献信息检索分析比较后,才能从论题的创新性、内容的科学性等方面进行质量评价,进而提高论文质量。

3.文献检索启发学生的创造性思维与研究能力

图书馆文献是过去知识经验的总结,也是未来知识发展的向导。在文献检索过程中与论题有关联的文献信息很容易激发、调动大学生的潜在知识和智能,并从中获得灵感。不同的观点和方法,可促进大学生以发散性思维思考分析问题,拓展认识的深度和广度,进而全面获取有关学科的文献信息,及时了解学科领域中出现的新问题、新理论和新观点。图书馆文献信息检索利用的过程就是提高大学生研究能力的过程

二、文献检索的途径与方法

1.分析研究课题,确定检索要求

在进行具体的文献检索前,首先要分析课题,抓住课题的本质和要求,掌握代表课题内容的主题概念及其相关事物。依据本课题主题词来选定相应的检索工具,并从中选定检索标志,确定检索途径。在这方面自然科学、工程技术、人文和社会科学等具有不同的检索内容和要求。

2.选择检索工具

目前全世界有 2000 余种手工检索工具(书本型检索工具),还有联机检索、光盘数据库检索、Internet 网络检索等计算机检索工具。选择检索工具可利用“检索工具书指南”以及各种检索教材来了解检索工具书的收录情况。结合本课题,针对图书馆文献资料收藏情况,确定采用手工检索与机检相结合的方法。常用的检测工具包括以下几种:

书本检测工具:全国报刊索引、复印报刊资料、报刊资料索引、中国社会科学文献题录、国外社会科学论文索引等。

光盘数据库:全国报刊索引数据库、中国学术期刊(光盘版)、中国科学引文数据库、中国科技期刊篇名数据库、中国科技期刊篇名数据库等。

网络资源:中国知网、中国期刊网、、院校图书馆等。

3.文献检索的途径与方法

文献检索方法可分为常用法、追溯法和分段法三种。常用法是利用检索工具查找文献的方法,有三种类型,一是顺查,是以检索课题起始年代为起点,按时间顺序由远及近的查找文献的方法。二是倒查,是逆时间顺序由近及远的查找文献的方法。三是抽查,是针对学科发展的特点,抽出该学科发展迅速,发表文献比较集中的一段年代,抽查某几年的书籍和期刊、数据库。追溯法是利用已有文献后面所附的参考文献进行追溯查找的方法。一般参考文献中的原文结尾都附有新的参考文献目录,可视需要一直追溯下去,从而获得足够的文献资料。利用这些资料特别要注意综述性的文献资料,因为这些资料已对某一问题进行了一定的归纳整理,这样可以节约查找、阅读原始文献的时间。追溯法比较适合初写论文的大学生选用。分段法是将常用法与追溯法交替使用,既利用工具书检索,又利用文献后所附参考文献进行追溯。

另外,要检索重点资料,掌握核心期刊。核心期刊是期刊中学术水平较高的刊物,是我国学术评价体系的一个重要组成部分。它主要体现在对科研工作者学术水平的衡量方面,如在相当一批教学科研单位申请高级职称、取得博士论文答辩资格、申报科研项目、科研机构或高等院校学术水平评估等,都需要在核心期刊上发表一篇或若干篇论文。某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。目前国内有 7 大核心期刊(或来源期刊)遴选体系:

(1)“北大核心”:北京大学图书馆“中文核心期刊”,即北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版的《中文核心期刊要目总览》,每四年修订一次,目前是 2012 版;

(2)“南大核心”:南京大学“中文社会科学引文索引(CSSCI)来源期刊”;

(3)中国科学技术信息研究所“中国科技论文统计源期刊”(又称“中国科技核心期刊”);

(4)中国社会科学院文献信息中心“中国人文社会科学核心期刊”;

(5)中国科学院文献情报中心“中国科学引文数据库(CSCD)来源期刊”;

(6)中国人文社会科学学报学会“中国人文社科学报核心期刊;

(7)万方数据股份有限公司的“中国核心期刊遴选数据库”。

文献收集与检索论文

文献检索方式:

1、直接法:又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、倒查法和抽查法。

2、顺查法:顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,需要了解其发展的全过程,就可以用顺查法从最初的年代开始查找。

3、倒查法:倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。使用这种方法可以最快地获得最新资料。

4、抽查法:抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。

5、追溯法:是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。

6、循环法:又称分段法或综合法。它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。

扩展资料:

文献检索作用:

1、报道文献信息

检索系统具有对文献信息予以揭示、反映、报道的功能。信息用户只有通过利用文献检索系统,才能对大量产生并随时更新的各种信息进行及时了解和系统的掌握。

2、存储文献信息

通过对大量分散而无序的原始文献进行了有目的的存储,并按照一定特征及规则组织,形成了包容各个年代、各种载体、各个学科门类的文献检索系统。

3、检索文献信息

通过对信息的报道和存储,把大量信息按外表特征与内容特征集中排序,实现方便、高效的信息检索,它是文献检索系统的最突出的功能。

计算机检索:

以计算机技术为手段,通过光盘和联机等现代检索方式进行文献检索的方法。与手工检索一样,计算机信息检索应作为未来科技人员的一项基本功,这一能力的训练和培养对科技人员适应未来社会和跨世纪科研都极其重要。

一个善于从电子信息系统中获取文献的科研人员,必定比不具备这一能力的人有更多的成功机会,美国报道生活新方式的期刊POV也将交互网络检索专家作为未来十大热门职业之一,这些情况都说明了计算机文献检索越来越重要,故值得大家对这一技术予以重视。

参考资料来源:百度百科——文献检索

写毕业论文时,该如何查找文献资料

大学生活要接近尾声了,我们毕业前都要通过最后的毕业论文,毕业论文是一种比较正规的检验大学学习成果的形式,那么问题来了,毕业论文应该怎么写?下面是我收集整理的写毕业论文时,该如何查找文献资料,供大家参考借鉴,希望可以帮助到有需要的朋友。

毕业论文不同于一般的论文,专业的毕业论文是某一学科领域的科研成果的描述与反映,没有研究,写作就无法进行.而研究的一定前提是必须掌握尽可能多的文献信息资料。一个人读的书越多、查找的资料越全面,专业水平就越高,创造性的思考可能性就越大,写出来的论文质量就更高。因此,大学生在写作毕业论文时,首先要学会如何检索文献资料,懂得文献查找的方法与技巧。

大学图书馆中都会引进一些数据库,提供给学生写毕业论文时,查找资料。

图书馆及其它文献信息机构收藏的文献资料有很多种类,随着Internet的流行,现在图书馆有很多电子期刊数据库可供选择。电子期刊数据库不但检索种类齐全,而且速度快,是当今科技人员资料查找的首选。

下面简单介绍几种目前用得较多的电子期刊数据库:

(1)中国知识基础设施工程网(CNKI数据库)。它是由清华同方光盘股份有限公司和清华大学中国学术期刊(光盘版)电子杂志负责牵头实施的.其建立的CNKI系列数据库包括期刊、报纸、博硕士毕业论文等,收录了自1994年以来的国内公开出版的6000多种期刊(编者注:现在已达到8400多种)和报纸上发表的文章的全文。

(2)万方数据资源系统。它是由中国科技信息研究所、万方数据集团公司开发的建立在因特网上的大型中文网络信息资源系统。它由面向企业界、经济界服务的商务信息系统、面向科技界的科技信息子系统及数字化期刊子系统组成。科技信息子系统是集中国科技期刊全文,中国科技论文与引文、中国科技机构与中国科技名人的论文和毕业论文等近一百个数据库为一体的科技信息群。数字化期刊子系统使得用户可在网上直接获取万方新提供的部分电子期刊的全文。

(3)中国科技期刊数据库。它是由重庆维普咨询公司开发的一种综合性数据库,也是国内图书情报界的一大知名数据库。它收录了近千种中文期刊和报纸以及外文期刊。

以上简单介绍的几种数据库在一般高校的图书馆里都可以查到。关于电子期刊文献资料的查找,可以分为两个层次:基本查找和追踪查找.所谓文献的基本查找是指文献的题目或内容一般无从知道,只知道该文献大致属于哪一个学科或者属于某一方面,或者只知道某些关键词;追踪查找则大致知道文献的题名、出处或者作者等相关信息.两个层次的查找方式有一些区别。

一般来说,关于电子期刊文献资料的检索往往结合两个层次的检索方法效果会更好。另外,关于书籍资料和博硕士毕业论文、会议论文的`检索,其检索方法基本上相同,只是所使用的数据库不一样罢了.所以,大学本科毕业生为了写好本科毕业论文,从毕业论文选题到文献资料的查找,都应当掌握一定的方法,才会收到事半功倍的效果。

拓展内容: 参考文献文献格式

一、规范的类型

(即引文出处)的类型以单字母方式标识,具体如下:

M——专著 C——论文集 N——报纸文章

J——期刊文章 D——学位论文 R——报告

对于不属于上述的文献类型,采用字母“Z”标识。

对于英文,还应注意以下两点:

①作者姓名采用“姓在前名在后”原则,具体是: 姓,名字的首字母. 如: Malcolm Richard Cowley 应为:Cowley, .,如果有两位作者,第一位作者方式不变,&之后第二位作者名字的首字母放在前面,姓放在后面,如:Frank Norris 与Irving Gordon应为:Norris, F. & .;

②书名、报刊名使用斜体字,如:Mastering English Literature,English Weekly。

二、举例

1.期刊类

【】[序号]作者.篇名[J].刊名,出版年份,卷号(期号):起止页码.

【举例】

[1] 王海粟.浅议会计信息披露模式[J].财政研究,2004,21(1):56-58.

[2] 夏鲁惠.高等学校毕业论文教学情况调研报告[J].高等理科教育,2004(1):46-52.

[3] Heider, . The structure of color space in naming and memory of two languages [J]. Foreign Language Teaching and Research, 1999, (3): 62 – 67.

2.专著类

【】[序号]作者.书名[M].出版地:出版社,出版年份:起止页码.

【举例】[4] 葛家澍,林志军.现代西方财务会计理论[M].厦门:厦门大学出版社,2001:42.

[5] Gill, R. Mastering English Literature [M]. London: Macmillan, 1985: 42-45.

3.报纸类

【】[序号]作者.篇名[N].报纸名,出版日期(版次).

【举例】

[6] 李大伦.经济全球化的重要性[N]. 光明日报,1998-12-27(3).

[7] French, W. Between Silences: A Voice from China[N]. Atlantic Weekly, 1987-8-15(33).

4.论文集

【】[序号]作者.篇名[C].出版地:出版者,出版年份:起始页码.

【举例】

[8] 伍蠡甫.西方文论选[C]. 上海:上海译文出版社,1979:12-17.

[9] Spivak,G. “Can the Subaltern Speak?”[A]. In & L. Grossberg(eds.). Victory in Limbo: Imigism [C]. Urbana: University of Illinois Press, 1988, .

[10] Almarza, . Student foreign language teacher’s knowledge growth [A]. In and (eds.). Teacher Learning in Language Teaching [C]. New York: Cambridge University Press. 1996. .

5.学位论文

【】[序号]作者.篇名[D].出版地:保存者,出版年份:起始页码.

【举例】

[11] 张筑生.微分半动力系统的不变集[D].北京:北京大学数学系数学研究所, 1983:1-7.

6.研究报告

【】[序号]作者.篇名[R].出版地:出版者,出版年份:起始页码.

【举例】

[12] 冯西桥.核反应堆压力管道与压力容器的LBB分析[R].北京:清华大学核能技术设计研究院, 1997:9-10.

7.条例

【】[序号]颁布单位.条例名称.发布日期

【举例】[15] 中华人民共和国科学技术委员会.科学技术期刊管理办法[Z].1991—06—05

8.译著

【】[序号]原著作者. 书名[M].译者,译.出版地:出版社,出版年份:起止页码.

三、注释

注释是对论文正文中某一特定内容的进一步解释或补充说明。注释前面用圈码①、②、③等标识。

【举例】

[11] 张筑生.微分半动力系统的不变集[D].北京:北京大学数学系数学研究所, 1983:1-7.

文献检索途径包括以下几种:一、著者途径 许多检索系统备有著者索引、机构(机构著者或著者所在机构)索引,专利文献检索系统有专利权人索引,利用这些索引从著者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为著者途径。二、题名包括书名、刊名、篇名等途径。 一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录。三、分类途径 按学科分类体系来检索文献。这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属范围来查找文献资料,并且可以起到"触类旁通"的作用。从分类途经检索文献资料,主要是利用分类目录和分类索引。四、主题途径 通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。五、引文途径 文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。六、序号途径 有些文献有特定的序号,如专利号、报告号、合同号、标准号、国际标准书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。七、代码途径 利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。八、专门项目途径 从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。

如果你是在校的学生可以去学校的图书馆进行借阅,当然你也可以在外找到图书馆去买你想要的论文集。

搜索论文检索报告

论文检索报告如下:

1.简洁报告单。

简洁报告单突出的是简洁而不“简单”,上半部分主要显示了被检测文献的基本信息,下半部分按照章节显示了各章节的相似文献信息。显示基本的文献检测信息,如“总文字复制比”、“去除引用文献复制比”、“各章节复制比”等数据。标明重合文字的出处,并且标明是否引用。

2.全文标明引文报告单。

全文(标明引文)报告单在简洁报告单的基础上,增加了被检测文献的全文, 红色文字表示文字复制部分,黄色文字表示引用部分。显示基本的文献检测信息。标明了重合文字的出处,并显示了详细的文字复制比。显示了检测文献的全文,并对重合文字进行了标红或标黄(引用部分)。

3.全文对照报告单。

就是把标红的部分和来源出处列举在一起,左边是原文,右边是来源部分,这样看上去非常清晰。显示基本的文献检测信息。不区分是否引用,对所有重合文字进行了标红,并与相似文献的具体内容进行对比。

4.去除本人已发表文献报告单。

去除文人文献报告单,只去除了本人发表的文献后的报告单。是在全文报告的基础上,去除了本人发表的文献的重合文字标红或标黄(引用部分)。

论文检索报告

首先要将论文检索报告和论文查重报告区分开来,不能混淆。所以到底什么是论文检索报告呢?其实,论文检索报告就是开具论文被文献数据库收录的证明(SCI,EI,SSCI,ISTP,CSSCI,CSCD,CPCI检索收录证明),一般交给科技查新站做,而一般这是需要付费的,国内知名高校图书馆一般可以开具这样的带公章的报告,具体哪些地方可以开带公章的报告需要自己去咨询自己学校的图书馆。

首先在浏览器地址栏输入知网的网站,或直接百度搜索找到知网。进入中国知网页面后,再单击【高级检索】。

在高级检索页面的【作者】和【作者单位】栏目处输入作者的姓名、单位全称或学校全称,输入完成之后单击【检索】,在排序选项里单击【发表时间】将搜索结果按年限排序。

选中需要检索的论文,再单击【导出/参考文献】。

接着会跳转到文献管理中心导出的页面,该页面中再次选中需要检索的论文,单击【导出/参考文献】。

最后会跳转到文献输出页面。单击【打印】即可。

论文的检索报告如何得出? 那个你可以去万方试下 不过是收费的 论文检索都是收费的没有免费的 已经发表的论文怎么要检索报告 1. 可以找高校图书馆,请他们出检索报告。2. 找查新机构,他们可以出具检索报告。 3. 上淘宝网,上面有不少的相关服务。 文献检索报告怎么写 论文资料检索分析一、分析课题,明确检索要求我的本科毕业论文题目是《金融风暴下的我国项目融资研究》,该课题是属于经济金融类,有关项目融资的研究,其研究的主要对象是我国。受美国次贷危机,美元贬值、国际石油价格和粮食价格不断攀升等主要因素的影响,2008年世界经济增长率明显下降。在经济发展全球化的形式下,我国的项目融资也遭遇了前所未有的困难,作为一国利用外资的有效形式,如何在金融风暴的环境下寻求新的出路?项目融资发展在我国还处于起步阶段,怎样尽快推进其的应用和发展呢?本人将运用所学的专业知识,结合奥运会和世博会,通过横纵向对比欧美、日本、东南亚等国的成功融资实例,分析解决这些问题。本论文采取的是文献研究、社会(市场)调查、查阅报刊与书籍和上网查询的方法,查找和分析资料,获得相关资料。因此,检索的核心内容是项目融资的概述及其组织结构;项目融资在我国的基本状况和发展;我国在政策、优惠性、合作方式等方面如何创新来吸引各方融;发达和发展中国家的项目融资给我国的借鉴等,所需的文献类型是基础理论性和实际案例的研究,一般都是侧重在期刊全文数据库、重要报纸全文数据库、万方数据资源中查找,而时间范围一般是从理论上升到实际中,为了掌握动态或解决某个问题,则根据具体情况确定检索时间范围。二、检索过程1、选择资料检索工具进行资料检索,可以从以下几个方面入手:(1)图书馆图书期刊馆藏查询,借阅相关图书和期刊;(2)电子资源查询,主要包括期刊全文数据库、重要报纸全文数据库、万方数据资源等;(3)指导老师的帮助,老师根据我们的具体情况,向我们提供相关书籍和电子资料;(4)在个别情况下,还会在百度、Google等网页查询,但获得的信息不够权威因此我不太采用这种方式。 一般情况下,我都是利用学校图书馆资源进行信息检索。在进行信息检索时,我重点采用电子资源查询,特别是在期刊全文数据库中查询。2、确定检索途径在利用数据库查找文献信息时,主要是利用检索工具的各种索引,一般来说,每种检索工具都提供几种检索途径,归纳起来可以分为:分类途径、主题途径、作者途径、题名途径、号码途径和其他途径。而我较常用的主要有分类途径和主题途径两种。在进入上海理工大学图书馆后,选择中国期刊全文数据库,根据检索导航中的分类选择“经济类”;如果有时间限制,则在检索年限中设置,而检索项一般选择主题或关键词,检索词就输入课题中的关键词,即研究的主要内容,根据我的课题,我就在检索词中分别输入“项目融资”、“融资案例”、“项目融资创新”等进行检索。这里还可以进行高级检索,在搜索结果项后面选择或“不包含”,并输入检索词进行二次检索,如在第一个检索词中输入“项目融资”,选择“并且”,输入第二个检索词“我国的项目融资”。对于所检索出来的记录可以根据时间排序,也可以根据相关度排序,一般情况下,我选择相关度,这样可以提高检索的准确性。万方数据资源的查询,与期刊数据库相类似,一般都是在这里的中国学位论文全文数据库中查询,可以先按数据库分类浏览,选择学位论文类,在分类中选择经济、科学、教育、体育,再进行检索项、检索词的输入开始检索。3、选择检索方法在多种文献检索方法中,我主要采用倒查法和追溯法,由近及远逐年查找文献,以便即使把握最新发展动态,并利用文献后面所附的参考文献查找其他的文献,这样就查找到很多相关的文献信息。4、信息的处理将所获得的检索结果加以整理,筛选出符合课题要求的相关文献信息,并下载保存。在CAJ、PDF等浏览器中选择有效信息,进行文字编辑及图形拷贝。最后将所获得的信息进行整理分类。 三、检索资料评述通过学校图书馆我一...... 论文的检索报告怎么要? 如果我发表了一篇论文,怎么在网上找这篇论文的检索报告​,跪求高手指点 10分 先搞清楚您发的期刊是什么网站收录,然后到相应的网站找到文章,然后登陆下载就可以了,如果没有账号的话, 可能需要付费,这个也不多,可以去学校图书馆试试,可以用学校账号登陆。 什么叫科技论文检索报告,从哪里可以检索呢?具体有哪些内容? 50分 你好,就按照你的要求给你完成一份啊 论文检索报告与检测报告的区别 论文检索报告是论文不端检测系统检测出来的结果,其实叫法不一样,但意思是一样的。这两者并没有区别,论文检索报告也就是论文检测报告。 关于论文查重,早检测有知网,维普通达,万方、paperpass等,对于要检测的人来说,可以看看。 教师职称需要论文检索报告怎么出 看你的发表的论文是在那个论文数据库检索的,然后出报告就是啦。具体问问你的投稿编辑,教师职称论文这方面你可以找原上草论文发表投稿的。 求助,评职称时需提交的"期刊检索报告"和“论文检索报告”怎么生成?要求是必须为主流检索系统生成的检 5分 内容通过百度网盘分享, 如果有帮助希望能采纳。 不懂得地方请私信 “什么晕和什么晕” 中国知网怎么生成检索报告 试试别的网站吧,中国知网的这个检索就是有问题 。 什么是论文网上检索页?怎么打印? (一)学术期刊检索页打印步骤: 1、进入我院图书馆网站——。 2 、点击图书馆网站主页上方“电子资源”栏目。 3 、进入中国期刊全文数据库或维普信息资源数据库。因镜像数据更新滞后,会出现文章已发表但库中检索不到的情况,建议使用包库(数据日更新)进行检索。 4、检索出个人期刊论文,点击论文名称后即为检索页。 5 、在网页窗口左上方,点击“文件”选项中的“打印”,打印检索页,检索页只需打印第一页。 (二)学术著作检索页打印步骤 1、进入中国新闻出版信息网——cpp/。 2 、点击网页上方“CIP中心”。 3 、进入后在网页右上方“CIP 核字号验证”检索栏中填写“CIP核字号”与“验证码”。 4 、点击“验证”后即为检索页,检索页默认为打印格式。 5 、在网页窗口左上方点击“文件”选项中的“打印”,打印检索页。 注:“CIP核字号”是图书版权页“ 图书在版编目(CIP)数据”中最后一行的两组数字;检索页打印只需第一页。 CIP核字号示例:其中最后一行中“2007047545”即为CIP核字号 图书在版编目(CIP)数据 数字参考咨询 : 中国的实践与研究 / 谢美萍著 . -- 长沙: 湖南师范大学出版社, ISBN 978-7-81081-708-0 Ⅰ. ①数… Ⅱ. ①谢…Ⅲ. ①数字技术应用-图书馆 工作-参考咨询-研究-中国Ⅳ. ① 中国版本图书馆CIP数据核字(2007)第047545号

毕业论文文献搜集与整理

我在这里想总结一下在做毕业论文过程中关于“如何进行文献整理以及数据处理”的经验。数据录入:1. 在施测之前,就要对变量的排列有总体的规划,尽量每一次施测的变量排序一致,那样以后录入时才不会混淆;2. 数据录入时,往往用的是数字代码,此时务必做好各个代码所代表的含义的备份,建议用记事本保持,以防时间长了遗忘,带来不必要的麻烦;数据处理:1. 务必做好数据备份,对不同的转换,建立不同的文档;2. 建立数据处理日志,以防当你的数据处理逐渐增多、数据有所转换之后不至于混淆,以及方便进行数据回述和检查;3. 建立“数据”和“结果”文件夹,分开保存数据和处理结果,避免不必要的混乱;4. 在給数据处理的程序命名时,建议按照处理顺序写上“序号.程序处理名称”,如“1.频数分析”、“2.因素分析”,这样可以一目了然地了解你的数据处理过程和数据处理内容;5. 保存具有代表性的数据处理的程序,这样做的好处是,一方面日后进行相同的数据处理时可以直接“copy”“paste”,很方便;另一方面也避免时日一长遗忘了部分程序;文献整理:1. 所收集的中外文献卷帙浩繁,建议保存文件名包括一下内容:“年份.序号.标题”;如“ ”、“ ”;2. 对所有收集的文献进行归类整理,分别放置于不同的文件夹;3. 有时你需要对外文文献摘要整理和翻译,此时建议你把摘要保存于当前文献所在的文件夹;或者专门建立“摘要整理/翻译”文件夹,以保存各类专题的摘要翻译,以防文献一多便混乱了,想要的时候找不到;4. 外文文献摘要整理文件名格式:“摘要整理.专题名.整理日期”。

参考文献是毕业论文中最为基础的,同时也是用处最大、影响最大的一个板块,在撰写论文的时候要以参考文献为基础,很多导师在指导学生论文之前要求学生在确定选题后先搜集不少于十篇关于本课题的相关研究文献,反复精读并提炼其中的论点,之所以要这样做是为了参考文献会直接影响整篇文章学术水平和价值,因此在提交毕业论文检测前一定要全方位的搜集参考文献。渠道一、学校图书馆图书馆和毕业论文可以说是官方标配,至少在毕业前的两个月里你每天要花大量的时间呆在图书馆。图书馆的图书量大且范围广,能够满足学生的要求,关键学校图书馆的文献资料权威度很高,不用担心自己找的文献有质量问题,但是大部分都是纸质图书,因此在后期引用的过程中会比较的麻烦,同时毕业论文检测也会受到影响。渠道二、互联网除了学校图书馆,互联网应该是大家使用频率最高的文献搜集渠道。目前比较受欢迎的有知网、百度学术、爱学术等,但是这些平台的期刊居多,对于博士和硕士论文的参考价值不高。最重要的是文献的质量和真实性难以查证,存在虚假信息和数据,因此在提交毕业论文检测前,建议大家权威的平台重新考证文献的来源。渠道三、学长学姐和导师建议你多结交几位你们学院的优秀研究生学长学姐,因为他们已经有了相关的经验并且手上的文献资料肯定是要比你的丰富,当然有的导师也会直接根据学生分的研究课题提供资料包,这些资料包的珍贵性可想而知,入伙你有幸进入行业交流群,那就更不用担心参考文献的搜集了,行业群往往能在第一时间发布最新的消息,如果你担心权威度,可以询问导师,当然,在毕业论文检测的时候,这些参考文献的质量也会一眼看出。

论文选好题之后,我们就要开始查找文献,搜索、查阅文献的目的主要有两方面:一是了解别人在这个领域曾做过哪些研究;二是为即将进行的研究寻找概念与理论的基础以及方法与设计的借鉴。当我们明确选题以后,怎么快速找到我们所需要的文献呢?我们都知道论文在期刊发表后,通常都会被中国知网、万方数据库、维普资讯网、龙源期刊网等一家或几家全文收录。怎么从中查找到我们所需要的文献资料呢,想必有不少同学还不清楚,今天我来教大家怎么用数据库中查阅所需要的文献,我们以知网为例,给大家讲解一下查询文献的方法。以《对工程项目目标成本管理与财务风险控制问题的分析》题目为例,从这个题目里面我们可以找出几个关键词:工程项目(a)、目标成本管理(b)、财务风险控制(c)。搜索方法:(1)直接搜索关键词:下面我们以“财务风险控制”这个关键词为例,我们在知网首页的搜索框输入“财务风险控制”这个关键词,直接搜索后可以获得高达117461条与之对应的文献。这样搜索出来的文献太多了,而且我们可以看到其中有很多与工程项目这块并不相关的文献,如果一篇一篇的去查找出来,会花费很多的时间,那么我们该怎么选择文献呢?后面我们还会提供几种搜索方式,检索出相关性高的文献。当然这个主题词是比较常见的,被研究的次数很多是自然的,如果是一些生僻的主题词,对它的研究很少,我们就可以分别用单独的主题词搜索,或者搜索其一些近义词的研究文献。(2)关键词组合搜索:可以选择多个关键词反复变换进行检索,以保证文献资料的充实和完整。比如关键词a+b,关键词a+c,b+c,甚至a+b+c结合一起搜索,这样找出的文献关联度会更高。例如:在知网首页搜索框中输入“工程项目 财务风险控制”点击检索,可以搜索出15121篇文献。这次我们检索出来的文献明显少了很多,但是还是太多了,而且很多文献的相关性都不高,接下来我教大家用高级检索功能筛选文献。(3)使用高级检索查找文献。打开知网的高级检索功能,首先选定学科领域,然后筛选自己的检索词,最好把自己想要了解的主题的近义词都写上去,这样可以提高检全率。另外可以限定文献的出版时间和期刊来源,以求检出高质量论文。可以按照年份进行阶段性的检索,比如第一次可以先选择2017年至2018年两年间的文献,如此既可以有效防止漏看或者重看文献,又不至于整理起来太杂乱。例如:从知网首页点击高级检索——选定学科领域(经济与管理领域)——在检索条件栏目输入“工程项目”和“财务风险控制”2个主题词——再选择发表时间:2014年5月1日-2019年5月1日,我们选择近5年来的文献——点击检索。这样我们可以检索出46篇相关的文献资料。(4)追溯法找文献:如果这样找到合适的文献比较少,我们还可以使用追溯法,是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。例如:我们从刚才检索出来的一篇文献为例,点击题目,下载如果可选择的文献还是太多,我们可以结合以下几个限制条件选择合适的文献:a、文献发表的时间,最好是最近5年的,如果最近5年的文献很少,那么可以把时间放长一点,如果近5年的文献太多,可以只看近2-3年的。b、尽量选择引用量和下载量比较多的文献,说明这些文献是大家普遍认可、阅读量比较多的文献;c、如果文献还是很多,那么我们就尽量选取一些本专业的核心期刊论文;通过上面这些搜索方法,一般来说,我们可以搜索到所需要的文献资料,而且相信这样找出来的文献质量和相关度都会比较高。接下来我们将选定的文献资料下载下来。选定一篇文献,点击题目进去,就可以直接进行下载了。文史哲学等社科类专业的,我这里给大家推荐一个免费查询网站——国家哲学社会科学文献中心,没有知网等账号的,可以通过这个网站查询下载一些文献资料也是很方便的,方法类似于知网查询,这里就不作详细介绍了。

1.广泛地搜集、阅读

论文提出的问题要集中,材料的收集却要尽可能地广泛。一般说来,至少要做好以下三方面的知识、材料准备。

1).能够反映研究对象本身各种具体特征的专题材料

充分熟悉对象,是正确认识对象的必不可少的前提。除了直接了解对象本身的各种具体特征还要把握一切能够影响研究对象的生成和发展变化的社会、历史条件或精神、物质因素。只有尽可能全面地掌握这些材料。进行研究时才能充分体现马克思主义的“活的灵魂”———对于具体情况作具体分析。

2).作为明确方向和思想指导的理论准备

科学实践和发展的历史告诉我们,进行一项研究工作,不仅需求充分的专业理论、知识,最好还能力求广泛通晓其它有关学科的理论和知识。通过不同学科的理论和方法的相互渗透,相互启发,往往可以更好地带来新的发现、新的突破。

3).别人对于这一问题已经发表过的意见

这方面的材料要尽量搜集。别人已经解决的问题,自然不必再花力气去作重复劳动;充分吸收别人已有的经验,或是了解别人所遇疑难的焦点所在,对不同观点仔细进行比较研究,既可以少走弯路,也便于发现问题。

2.认真地整理、辨析

要使材料发挥作用,还需运用科学的观点和方法,去粗取精,去伪存真,使材料系统化,条理化,这样才有助于分析、解决问题。整理材料的形式大致有以下几种:

1).制成文献、资料的目录索引。可以利用有关的现成材料(图书馆、资料室的目录卡片和报刊索引等),根据自己的选题加以编写。

2).剪报、札记、文摘卡。这一类资料的搜集整理工作,必须力求眉目清楚。一要详细注明每则资料的作者、篇名、出处、发表日期,二要有细致合理的分类。

3).大事记、年谱或著译年表。通过这一类材料的编写,可以加强对于研究对象的总体印象,有助于在胸有全局的基础上深化对于某一专题、某一侧面的研究。

这些技巧你掌握了吗?

搜索引擎信息检索论文

我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本,贴在下面:网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。.信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之,2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔41。信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词。

网络信息检索方法与应用这个原创。联系看我资料

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1(1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。(2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。(3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 集群系统的设计由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法:XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。图 网格中间件的设计图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下:(1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。(2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。(3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。(4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。(5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。文秘杂烩网

相关百科