网络信息检索及其前沿技术的发展_信息技术网络信息检索

其他范文 时间:2020-02-27 14:55:29 收藏本文下载本文
【www.daodoc.com - 其他范文】

网络信息检索及其前沿技术的发展由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“信息技术网络信息检索”。

目 录

摘要......................................................................................................................................(1)1因特网信息检索概述.............................................................................................(1)2因特网信息检索的方法.......................................................................................(2)

2.1因特网信息检索的一般方法........................................................................(2)

2.1.1网上漫游..................................................................................................(2)2.1.2顺“链”浏览.........................................................................................(2)2.1.3 利用搜索引擎进行信息检索..........................................................(2)

3因特网信息检索的特点.....................................................................................(3)

3.1超文本检索..........................................................................................................(3)

4网络信息检索遇到的挑战..................................................................................(3)5网络信息检索的前沿发展技术及展望........................................................(4)

5.1智能化信息检索.................................................................................................(5)5.2 可视化信息检索.............................................................................................(6)5.3 一站式信息检索.............................................................................................(7)5.4 个性化信息检索.............................................................................................(7)

6致谢.......................................................................................................................................(8)

参 考 文 献........................................................................................................................(9)

Abstract ···························································································································(10)

网络信息检索及其前沿技术的发展

作 者:1111 指导教师:11111

摘要:现代信息检索技术经历了由低级到高级的发展过程。目前正朝着多元化的方向发展。本文主要从信息检索的智能化、专业化、可视化、一站式及基于网格的5个方面来介绍现代信息检索技术的发展趋势。因为随着信息技术的发展和用户检索需求的变化,现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。本文探讨了现代信息检索技术发展趋势,从智能化、个性化、一站式、可视化四个方面进行了分析,对检索技术发展趋势展开了一定的探讨。

关键词:因特网; 信息检索; 前沿技术 ;搜索引擎

1因特网信息检索概述

因特网信息检索是现代网络技术带来的必然课题,当网络成为信息世界中的一种无所不在的承载体,每一个检索者都可以随时随地截取和输送最新的各种信 ,面对这样一个庞大无比、动态变化的网络信息 , 要想获得某个用户所需特定信息 , 必然还要依赖于因特网上的信息检索。因特网信息检索是由众多站点、浏览器和搜索引擎及网络支撑组成的三角结构。其中的核心部分,不是众多站点,而是网络浏览器和具有收集、检索功能的搜索引擎。

众多站点、网页上的信息是因特网上信息的基本组成部分。在因特网发展初期,浏览器和简单的搜索引擎即可帮助人们检索所需的文献信息。浏览器 ,相当于提供了一个信息总目次 ,提供读者和用户对一个又一个网站进行直接地点击、浏 ,通过超文本链接 ,选择自己所需的信息。浏览虽然方法简易、直接,但随机性强,耗时量大,对于搜索因特网上的信息来讲时间和费用较高,因此更科学的方法是要借助搜索引擎。搜索引擎是因特网信息的网上检索工,它可以帮助用户快速搜索所需信息及其相关信息。搜索引擎是因特网上设立的一种特殊类型的站点,通过用户输入所需信息的关键词, 经由检索服务器处理内部数据库,找到相关资料并整理后送出,通过网络传给用户使用的主机,即可以通过下图所示的简单流程图来表示。这是就其检索功能而言,对因特网上的信息检索来说,它也离不开数据库的支持,而因

第1页(共10页)特网上数据库的收集、整理,是搜索引擎具备的另外一部分功能。

2因特网信息检索的方法

2.1因特网信息检索的一般方法

如果用户要在因特网上获取信息,就必须能够找到提供信息的服务器。所以,首先以找到服务器在网上的地址(URL)为目标 , 然后通过该地址去访问服务器提供的信息,它的检索方法一般来说有以下几种。2.1.1网上漫游

这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强 , 其不可预见性、偶然性使检索过程具有某种探索宝藏的意味,也许会充满乐趣 , 但也可能一无所获。2.1.2顺“链”浏览

指用户在阅读超文本文档时, 利用文档中的链接从一个网页转向另一个相关网页。有些类似于传统文献检索中的“追溯检索” , 即根据文献后所附的参考文献目录去追溯相关文献,一轮一轮地不断扩大检索范围。这种方式可以在很短的时间内获得大量相关信息 , 但也可能在“顺链检索”中偏离了检索目标,或迷失于网络信息空间中 , 而且找到合适的检索起点也并不容易。

通过网络资源指南(res ource guide)来查找信息为了对因特网这个无序的信息世界加以组织、管理 ,使大量有价值的信息纳入一个有序的组织体系,专业人员做了许多努力和开发。也就是基于专业人员对网络信息资源的产生、传递与利用机制的广泛了解和对网络信息资源分布状况的熟悉 , 以及对各种网络信息资源的采集、组织、评价、过滤、控制、检索等手段的全面把握而开发出的可供浏览和检索的网络资源主题指南。综合性的主题分类树体系的网络资源指南 , 如 Y ahoo 等。而专业性的网络资源指南就更多了 , 几乎一学科专业、重要课题、研究领域的网络资源指南都可在因特网上找到。

2.1.3 利用搜索引擎进行信息检索

它是较为常规普遍的网络信息检索方式。搜索引擎是提供给用户进行关键词、词组或自然语言的检索工具。用户提出检索要求 , 搜索引擎代替用

第2页(共10页)户在数据库中进行检索 ,并将检索结果提供给用户。它一般支持布尔检索、词组检索等功能。利用搜索引擎进行检索的优点是: 省时省力,简单方便,检索速度快、范围 ,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理 , 且检索软件的智能化不是很高,造成检索的准确性不是很理想 ,与人们的检索要求及对检索效率的期望有一定的差距。目前在因特网上的搜索引擎层出不穷,比较有影响的英文搜索Y ahoo , AltaVista 等;比较有影响的中文搜索引擎有网易、搜狐、新浪等。

3因特网信息检索的特点

检索范围大 ,因特网是一个全球性的网络 , 信息资源分布在世界各地的服务器上 , 可供检索的资源包括大量的主页、多种报纸、全文期刊、各种组织机构发布的信息用户新闻以及原始技术报告等。3.1超文本检索

因特网检索的结果是完全可以直接阅读和利用的 Web页面文献全文。而且只需要简单地用鼠标点击 , 即可随意浏览。在多媒体的超文本中 , 不但有文字、图片 ,还可以有声音、动画、影视等形式的信息内容。界面友好 , Web信息检索工具界面丰富友好 , 使用户的检索相当方便 , 十分易于操作。Web 信息检索途径较多甚至还可按相关性程度对检索结果进行排序输出。检索时 , 只需按一定规则输入检索式 , 在发出检索命令后即可获得检索结果 , 通常检索结果包括文献页面的题名、内容简介、URL 地址等 ,并可据此获得更详细的超文本页面。良好的反馈能力和快速响应能力 , Web信息检索工具通常采用全文单词标引的方式 ,将因特网上的文本页面进行全文单词的自动倒排,建立庞大的索引数据库。这些Web信息检索的索引数据库 , 常常 24 小时就更新,大量的基于全文的单词倒排工作,通常是借助于有关的程序软件自动运行的 ,因而具有良好的信息反馈功能和快速响应功能。

4网络信息检索遇到的挑战

网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检

第3页(共10页)索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。

网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。(3)网络信息日新月异的变更,人们总是期望挑出最新的信息。然而网络信息时刻变动,实时搜索几乎不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。

5网络信息检索的前沿发展技术及展望

现代信息检索技术经历了由低级到高级的发展过程。目前正朝着多元化的方向发展。主要从信息检索的智能化、专业化、可视化、一站式及基于网格的5个方面来介绍现代信息检索技术的发展趋势。

随着信息技术的发展和用户检索需求的变化,现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。本文探讨了现代信息检索技术发展趋势,从智能化、个性化、一站式、可视化四个方面进行了分析,对检索技术发展趋势展开了一定的探讨。

信息检索技术经过先组式索引检索、穿孔卡片检索、缩微胶卷检索、脱机批处理检索发展到今天的联机检索、光盘检索、网络检索等。其发展经历了由低级到高级的过程、传统的线性检索向超文本支持的非线性检索

第4页(共10页)发展。这主要依赖于信息技术的发展和信息用户的信息检索需求。这些始终是推动现代信息检索理论与技术发展的重要动力。那么,现代信息检索技术的发展趋势将来如何呢?而要对信息检索技术的发展作出成功的预测是十分困难的。但是可以在广泛调研、比较、分析的基础上把握其某些发展动态,发现一些影响现代信息检索技术发展的新变化、新技术、新理念。5.1智能化信息检索

智能化信息检索是人们把人工智能与信息检索技术结合起来应用于信息存取领域的成果。近年来Internet上不断涌现的人工智能产品。比如智能搜索引擎、智能浏览器、智能代理、知识共享智能体等。都将大大提高信息存取系统的智能化程度。智能化信息检索是当今信息检索技术研究的热点问题之一。也是未来信息检索主要的发展方向。智能化信息检索是基于自然语言的检索形式.机器根据用户所提供的自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,它能够代替或辅助用户完成诸如选词、选库、构造检索式。甚至在数据库中进行自动推理查找等功能;系统对知识库检索推理的结果。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息存取系统。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预.这意味着用户将彻底从繁琐的规则中解脱出来。它是人工智能与检索技术的有机结合。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。IBM的最新研究的检索系统Piquant能够基于对问题回答来完成用户的检索要求。Piquant能分析文章的语义结构,并揭示其没有显示的表现出来的知识。IBM研究人员演示了在Pinquant中提问“谁是加拿大总理?”,系统准确地找到了回答这个问题的文章,虽然在这篇文章中没有显示的提到我们提问中的单词。

提高信息检索的智能化是信息检索所致力于实现的一个重要特征,它包含2个方面的含义:一是用户检索需求理解的智能化。比如AskJeeve,AnswerBus(http://www.daodoc.comprehensive breakthrough occurred.This article discues the trend of the development of modern information retrieval technology, intelligent, personalized, one-stop, visualize, four aspects has carried on the analysis of the retrieval technology development trend is discued.Key words: the Internet;Information retrieval;Cutting-edge technology;The search engine

第9页(共10页)

下载网络信息检索及其前沿技术的发展word格式文档
下载网络信息检索及其前沿技术的发展.doc
将本文档下载到自己电脑,方便修改和收藏。
点此处下载文档

文档为doc格式

    热门文章
      整站推荐
        点击下载本文