信息推拉技术 信息推拉技术

信息推拉技术

  • 期刊名字:情报科学
  • 文件大小:680kb
  • 论文作者:王辉,陈凌,张丽娟
  • 作者单位:东北师范大学传媒科学学院,吉林大学管理学院,吉林省科技信息研究所
  • 更新时间:2020-10-30
  • 下载次数:
论文简介

第22卷第12期情报科学Vol.22,No. 122004年12月.December, 2004信息推拉技术王辉l陈凌°张丽娟’(1.东北师范大学传媒科学学院,长春10000: 2.吉林大学管理学院,长春1300223.吉林省科技信息研究所,长春130000)商要随着网络技术的发展,对信息推送和拉取技术的研究不断升温,尤其是将两者相结合的智能技术引起了人们的关注。本文着重介绍了网络信息拉取服务、网络信息推送服务以及如何将两者有机的结合的智能技术。关键词信息拉取技术 搜索引擎信息推送技术 信息“推一拉”中图分类号G202文献标识码A文章编号1007-7634 (2004) 12- 1440-04Information Pull and Push TechnologyWang Huil Chen Ling° Zhang Lijuan'(1. Communication and Media Science College of Northeast Normal University, Changchun 10000;2. Management School of Jilin University, Changchun 130022;3. Institute of Scientific & Technical Information of Jili, Changchun 130000)AbstractWith the development of network technology ,scholars are focus on information pull and pushtechnology, especially the technology with both. This paper discusses information pull service; informationpush service and information pull and push technology.Keywords Information pull technology Search engine Information push technoloxy Information pulland push technology现代信息科学技术的发展,为人们提供了多种(1)分类目录(Classification Catalog Engine)。多样的信息获取和传递技术,其中“信息拉取技这类搜索引擎使用网站分类技术,即把网站进术”和“信息推送技术”及其相结合的智能信息技行树状的归类,对每个站点都有简略的描述。分类术成为国内外学者研究的焦点。目录将网站系统地分类整理,提供一个按类别编排网络信息拉取技术是指用户有目的地在网络上的网站目录。在每一类中,排列着属于这一-类别的主动查询信息,用户从浏览器给Web发出请求,由网站的站名、网址链接、内容提要以及子分类目录。Web获取所需信息。随着Internet上资源的日趋丰当然,为了分类科学准确,需要有一支由各学科高富,面对拥有海量信息的网络环境,为了能快速、高素质人才组成的维护队伍。这些编辑人员在访问了效地寻找有用信息,搜索引擎应运而生。1994年初,某个Web站点后撰写一段对该站点的描述,并根据第一代真正基于WWW的搜索引擎诞生,到1995站点的内容和性质将其归类,把站点的URL年,商业化的搜索引擎开始大规模开发,其第一代(Uniform Resource Location, 统一资源定位符) 和产品的代表厂商包括Yahoo!、Excite、Info seek.描述放在这个类别中。当用户查询某个关键词时,搜AltaVista等,并从典型的目录式分类结构发展到全.索软件只需在这些描述中进行搜索即可。文搜索引擎、图形图像搜索及元搜索。实践表明,搜分类目录式搜索引擎由于其目录是依靠人工来索引擎是有效的网络信息拉取的辅助工具,Internet评价一个网站的内容,因此用户从目录搜索得到的上资料库的检索主要是利用搜索引擎来实现。结果往往更具参考价值。这类搜索引擎因为加入了人的智能,所以所发信息准确、导航质量高;觖点1搜索引 擎(Search Engine)是需要人工介入、维护量大、信息更新不及时、成本中国煤化工按照搜索引擎提供的功能和使用的技术来划THC N M H GEngine)。分,目前Internet.上的搜索引擎有以下基本类型。网页搜索引擎同分类目录的最大区别是搜索结收稿日期: 2004-08-2012期.信息推拉技术1441果不是网站信息,而是符合检索条件的网页信息。这结果信息来自不同的独立引擎,但经过处理后以统类搜索引擎采用基于Robot的技术,它利用一个被-形式显示,并且对重复的内容进行了综合整理。服称为Robot (也 叫做Spider、Web Crawler 或Web务方式为面向网页的全文检索。严格地讲,元搜索Wanderer)的程序自动访问Web站点,机器人程序引擎只是以一个代理的角色接收用户的查询请求。以某种策略自动地在Internet 中搜集和发现信息,元搜索引擎的优点是返回结果的信息量更大、由索引器为搜集到的信息建立索引,由检索器根据更全;缺点是不能够充分发挥所采用的搜索引擎的用户的查询输人检索索引库,并将查询结果返回给功能,用户需要做更多的筛选。现在的元搜索引擎用户。服务方式是面向网页的全文检索服务。都只能进行简单的关键词查询,不支持复杂的高级该类搜索引擎的优点是信息量大、更新及时、不条件查询。这是因为不同的搜索引擎所能支持的高需要人工千预;缺点是返回信息过多。此外,还有级查询不同,处理方式差别也很大,元搜索无法同两个问题:一个是用户有时很难简单地用关键词或时向多个搜索引擎提交高级条件查询。关键词串来准确地表达需要检索的内容,表达困难现在主要的几个元搜索引擎都是英文搜索引导致检索困难。擎,还没有中文的元搜索引擎。元搜索引擎的技术另一个是随着时间、地域或领城的改变,同一仍在快速发展,它的一些缺点会有所改善。这类搜概念可以用不同的形式来表达,如“计算机”、“电索引擎的代表是Hotbot、Lycos、 Met Crawler等。脑”和“微机”;而同一个词也有可能表达不同的意网络信息的拉取服务除了能提供传统信息服务义,如“Java”可以指一种编程语言、印度尼西亚的提供的对目录、题名、分类、主题等检索外,更重.一个岛或一种咖啡豆。要的是提供了全文检索的功能。全文检索在传统信(3)图形图像搜索(Image Engine). .息服务中是不可想象的,计算机技术的发展使全文图形图像搜索引擎是专门搜索图形、图像(照检索成为可能,而且在信息的提供上由文献单元,进片)的搜索引擎,它是一种新的搜索引擎服务。由-步细化到信息单元,既提高了信息检索的精确度,于涉及到图像等多媒体信息,因而图形图像搜索引又减轻了网络传输的负担。擎的数据库组织需要采用不同于网站和网页搜索引擎的技术,需要充分考虑到多媒体信息的组织和查2网络信息推送服务询问;题。实际上现在的图形图像搜索引擎使用的基本技信息推送技术是一种信息获取技术,是实现网术仍然是传统的“网站搜索引擎”和“网页搜索引上主动信息服务的关键。信息推送就是信息服务公擎”的基本技术。目前图形图像搜索引擎可以分为司或网络公司通过一定的技术标准或协议,从网上两类:-类是搜索引擎等门户网站提供的图形图像的信息资源或信息加工者那里获取信息,然后通过搜索,用户仍然是通过文本关键词或分类目录查询固定的频道向用户发送信息的新型信息传播系统,相关的图形图像信息;另一类是一-些专业图库提供这是一种按照用户指定的时间间隔或根据发生的事的图形图像搜索引擎,这些图库- -般都由专门的机件有目的地按时将用户感兴趣的信息自动推送到用构维护,收录有某一方面的珍贵图像信息。户的计算机中的数据发布技术,从技术上看,推送现在图像检索技术正在向利用图像的颜色特技术就像是广播电台播音,是多点发送和多址发送征、形状特征、纹理特征等内容特征进行查询(即内容传递的结合。应用信息推送技术建立的“网络基于内容的检索)的方向发展。广播站”(Web casting),也就是网络信息广播系统(4)元搜索(Meta Search Engine)。通过智能化的代理服务器从Internet上不断取回用这类搜索引擎自己并不收集网站或网页信息,户所需的信息,将信息进行分类,同时在主机上设通常也没有自己的资源库和Robot,当用户查询一立了 固定的“信息频道”和“信息树”,供用户对网.个关键词时,它把用户的查询请求转换成其他搜索上信息中国煤化工网后,通过客户机引擎能够接受的命令格式,并行地访问数个传统的随时获TH, CNM HG项道推送和邮件推搜索引擎来查询这个关键词,然后将返回的结果进目利m兀的征A议不工两日行重复排除、重新排序等处理后,作为自己的结果送两种方式。频道推送:是目前网上普遍采用的一返回给用户。当使用元搜索引擎进行搜索时,虽然种推送模式,它将某些网页定义为浏览器中的频道,1442情报科学22卷用户可以像选择电视频道那样去选择收看感兴趣解决“推送”技术应用推广过程中所遇到的难题。比的、通过网络播送的信息。邮件推送:用电子邮件如,如何从海量信息中提取有用信息、如何提供个方式将有关信息发布给在列表中注册的用户。这种性化信息服务等。我们正在也将继续致力于这方面方式只需要实现一个基于Web的E-mail发送系的研究工作。统。信息推送服务具有传统定题服务新颖、及时、针对性好的特点,因此又被称为网络时代的定题服务3信息“推一拉”结合(SDI)。信息推送服务就是一种按照用户指定的时间间“拉”技术从信息传输方式看,是用户通过隔或根据发生的事件把用户选定的数据自动推送给Browser (浏览器)向Server (服务器)发出服务请用户计算机的新型服务。可以说,信息推送服务是.求.Server在所拥有的信息资源中进行查询处理,把传统定题服务在网络环境下的一种再现。这种服务处理结果传回Browser的用户。在“拉”技术中,主模式首先要求用户建立个人文档,包括用户的个人动的一方是Browser, Server 是根据Browser的请档案、兴趣爱好、所感兴趣的信息资源、基本学科求,被动进行信息发布。网上主动信息服务系统是等等,然后由系统在图书馆内进行定期的搜索,最以“推”技术为基础的。所谓“推”技术就是Server后定期将有关信息推送至用户主机上。比起用户自根据事先规定的设置文件,主动从网上搜寻信息,经助式的网上搜索信息,推送服务的最大特点就是能过筛选、分类、排序,按照用户的特点要求主动向实现用户一次输入请求而定期地、不断地接受到最Browser (用户)推送信息的技术。它是一个基于新的专题书目、图书等信息产品。对于使用效率较.Internet/Intranet网络环境的一个高度专门化、智高的信息产品,还可以存储于信息服务产品开发数能化的网络专题信息服务系统。据库中,从而更进一步简化服务程序,提高服务效“推”技术是相对“拉”技术而言的。-般情况率。下,“拉”方式是用户控制信息的查寻和获取,而迄今为止,“推送”技术最成功的应用是在一些“推”方式则是由信息的生产者或信息系统来控制信特定的领域,针对特定的用户群体。例如,在大型息的流向。从信息传递角度分析,“推”方式的意义企业中,对库存管理的一般方式是:当某一种原材在于:①从用户找信息的传统模式改为信息找用户料的库存量减少到一定量时,仓库管理部门就通知的主动模式;②经过“筛选”或“过滤”的信息更采购部门采购这一原料。如果将“Push” 技术应用符合用户的需要;③直接推送至桌面的信息避免了到这一过程中并与工作流相结合,那么就可以最终不必要的广告手段;④锁定网上特定的用户群,有自动完成这一-任务。在这一-应用中,发送的对象是利于促进信息机构开展专题信息服务;⑤按-定定确定的,而且是在需要时才发送,与工作流相结合制组织与发送信息,缩短了用户在网上的浏览时间,则可实现状态跟踪,从而确保发送成功。节省了带宽,减少了无效信息的流量。与特定用途的“推送” 技术应用相比,在通用3.1 信息“推一拉”的结合方式Internet 信息平台上应用“推送”技术要复杂得多。但无论如何复杂,“推送”技术最终需要解决的问题信息“推一拉”有以下多种方式。是“推什么,推给谁”。因此,“推送”技术中最关(1)“先推后拉”式:先及时地推送最新信息键,也是首先要解决的问题是对信息的分类及处理。(更新的动态信息),后有针对性地拉取所需的信息。而目前我们所面对的信息特点是:信息量巨大,信这样,便于用户浏览信息变化的新情况和趋势,从息类型难以估计和难以人工处理,如何使用机器进.而动态地选取需要深人了解的信息。行自动处理。针对上述问题,要使“推送”技术最.(2)“先拉后推”式:用户先拉取搜索所需信息,终得以成功应用,引入“人工智能”将是值得探索可根据用户的兴趣,再有针对性地推送相关的其他的一个方向。信息中国煤化工台节目点播等。我们认为,在目前“推送”技术的基础上融入息推送过程中,允许CNMH(人工智能、知识发现技术、Internet 及数据库技术,用户随时中国、足借仕川您大趣的网页上,并进一从而形成“智能信息推送”技术,是“推送”技术步的搜索,主动拉取更丰富的信息。的一个发展方向。上述技术的引人,可以从根本上(4)“拉中有推”式:在用户拉取信息的搜索过12期信息推拉技术1443程中,根据用户输人的查询信息,信源主动推送相在向我们走来。面对海量信息,要高效率、高质量关信息和最新信息。例如,在电子商务领域,当商地获取实用信息,推送和拉取相结合的“智能信息家发布供货信息后,信源将该信息存入供货数据库,推拉技术”是未来信息获取技术的一个重要发展方供其他需求用户检索;将需求信息存人需求数据库,向, 推拉技术也必将会带来网上信息获取方式的一对供需信息进行匹配,把经过排序和过滤的信息再次大变革。推送给用户。交易的匹配是一个复杂的过程,不仅要参考文献考虑到产品的分类、价格,还要考虑产地、运输条件等多方面因素,这就需要利用人工智能技术进行分1涂序彦.智能信息“推拉”技术,计算机世界,2000-04-析和处理,使用户最终得到一组符合条件的信息。2 Palm OS, Then Palm OS Platform:a new form of comp-3.2 信息“推一拉”技术建立的服务模式uting , International Conference on Autonomous Agents.(1) 自动拉出:它有一组可供用户群经常查看Agents http: //www. palmos. com/ ,ACM Press,2001,的web页,并可保存起来供以后阅读,读者还可以108~1153焦玉英,姜凌.网上主动信息服务系统的模型及其实现通过电子邮件接收这些资料。(2)频道式推送:专业信息服务频道的建设是技术。中国图书馆学报,2001 (1)图书馆向特定学科专业用户群进行网络信息资源服4李秀.推送技术一- 完善网络信息服务的关键技术.现.代图书情报技术,2001 (5)务的一个针对性很强的服务形式。频道是一个定期5 R. Ashri, Atkinson, D. Ayers, M. Haglind, B. Ray,更新、定期通知的web站点。由于采用了推送技术,Retranslationis in broadcast push, University of lranian,使得用户像选择电视频道那样来接收获取由网站自Machine, R. Taylor, C. Wigglers, Professional Java动发送的最新专业和学科的信息资源,它还提供了Moblile COmputer Science Department, Technical拨号用户离线浏览的功能。Report No. 98- Programming, Works Press, 2003, 26(3)自动推送:自动推送能根据自身的刷新时6 M. Franklin, Back Web Push Application Server, http间发布信息,用户群可以预定推送信息服务,在一: //www. backweb. com/products/html/pas. html ,2003般情况下,这种服务要求在用户终端上装有特殊的7涂序彦,曹斌,陈鸿绢.智能信息“推-拉”的方法与技术。计算机世界,2001-11-12客户机软件,定期发出更新要求。8蔡丽娟,等. Push/Pull技术及在Domino上的实现.计(4)邮件式推送:用电子邮件方式主动将所推算机工程与应用,2003 (10)送的信息提供给用户群。包括团体组织机构或者有9 s. Acharya, S. Zdonik , Balancing push and pull suppor-相同信息需求的个人用户群。ting IS/IT management decisions , Logistics Inforfor data(5)网页推送:在一个特定网页内推送信息给broadcast, in: ACM SIGMOD Conference, Tucson,用户群。matron Management , Emerald 12(1/2) (2002)182~ 188.(6)专用式推送:采用专门的信息发送和接收10 Slonmon- M. When push comes to pull :serving current软件,信源将信息推送给专门的用户群,如机密的awareness applications in your company's newscafeteria. Searcher 2002,7 (6)点对点通信。采用“Push+Pull"的方式,服务器不仅要把信11 刘建华,袁祖强、基于“推一拉”技术的Intranet信息发布模型,计算机应用研究,2002 (3)息推给用户,而且还能够按照用户预先设定的触发12 I. Marisa, A daptive collaboration for pushing and事件和发送要求,在条件满足时自动向用户发送消pulling, IEEE Internet Computing,2001: 25~35息。真正的个性化应该是动态而主动的,在最初的13 J. Beret, What's all - wrong with today's push tech-规则制定好之后,系统能够自动跟踪用户的使用倾nology,International Bi 一Conference Workshop on向,结合人工智能的推拉技术能够为用户提供更好Agent - Oriented ZDNet Anchor Desk ,http: //www5.的服务。中国煤化Information Systems,人类已迈向网络时代,信息推送和拉取技术正MYHCNMHG(责任编辑:孙晓明)

论文截图
上一条:JSP技术研究
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。