基于P2P的网络资源搜索引擎研究
每一次查询所涉及到的回答域都很有限并且基本,, 传统的信息检索资源存放于固定的集中数据库 上保持固定不变这就是著名的局部性现象或局部。 “或分布式数据库中而在 系统中节点可以自由加 ,P2P ,性原理计算机体系结构中关键技术之一的 ”,Caching 入或离开网络信息检索面对的是不断动态变化 ,P2P
的分布式信息资源目前对于分散式结构化 可 。 ,P2P, 就是程序执行过程中的局部性原理的有效应技术,
创建全局文档索引每个节点负责管理全局索引的一 , 用局部性原理有时间和空间两方面的含义时间局。 ,部分和相关公告列
对于分散式非结构化 无法 。P2P,部性最近访问的指令和数据很可能在不久的将来再 ,建立全局统一的文档索引每个节点只负责管理本地 ,次被访问即下一程序指令在前条指令附近的概率非 ,文档的索引提问被广播到网络中的所有节点,。 常大因此时间局部性往往会引起对最近使用区域 ,,
的集中访问空间局部性指的是一个进程访问的各项 ,
地址彼此很近即下一次数据访问在前次访问的数据 , 对等网络的特点1 附近的概率非常大前者就是程序 后者就是 。 Cache,
随着终端技术和网络接入技术的发展终端的能 ,数据 的理论依据同样的事实在网络资源访问 Cache 。
力越来越强采用处于网络边缘的终端的协作来 ,P2P 中依然存在就每一个访问成员而言下一次的网络 ,,弥补和解决集中式架构导致的性能瓶颈对等网络 “”。 资源访问的回答节点落在前次网络资源的回答域中 的特点是非中心化可扩展性健壮性高性价比和隐 、、、的概率非常大。
私保护。
表 查询节点的多级回答域 表结构示意图1 MRD-Cache 资源搜索效率的两个关键问题2 MRD Hops ID 1 1 1 技术与资源搜索 2.1 Caching 2 3 1 分布式索引缓存方法是一个比较新的课题在无 。 3 1 2 … … … … 结构对等网络中分布式索引缓存方法基本的思想是, i … j 现 以较低的代价扩大网络中的索引信息数量来提高网… … … … 代200 2 t络的搜索性能在对等网络中索引信息的扩散是通 。 , 计过查询来驱动的成功的查询结果被缓存下来使得 ,, 算方法利用了网络资源局部性分布的规律, MRD 索引信息可以在网络扩散开来资源搜索效率可否再 。 机 记录网络资采用在查询节点中增加 表, MRD-Cache 次成百倍地提高即在用户未提出问题时就为他 —,—, 源的分布状况从而加速资源定位提高网络资源搜,,总准备好答案技术可以使资源搜索效率达到, ,Caching
索效率由以上
可知方法是有效的网格资。 ,MRD 第
三 一收稿日期修稿日期,2009-05-07 ,2009-06-18 一作者简介蔡立斌湖北京山人硕士讲师研究方向为智能信息处理网络安全,,1975,,,,,,、 期
, 趨趮 M O D E R N C OM P U T E R200 9,7
构和组成网络的对等点的身份都无法确认。的方式搜索其他节点上的文件发起搜索操。 (Flooding)
而接到作的节点向所有邻居节点发送 消息, Query 结 语3 消息的节点进行本地查询并把查询进一步转, Query 未来的网络将呈现大规模分布式全球性计算和、发给自己的所有邻居这一消息广播的过程重复进 。 全球性存储的特征从长远的趋势来看对于访问和,, 行直到满足一定的结束条件为避免无穷递归每个,。 , 传输服务的需求必将远远大于对于计算功能的需要搜索消息都有一个 域它随着转发 TTL(Tmie-to-Live),尤其是 与网格技术的结合将是分布式计算技术 P2P 的进行而递减为零的消息则不再被转发,TTL 。 最有吸引力的发展趋势虽然现在还没有成熟的方, 每个请求都有一个准一的标识号已收到请求的。 案但随着分布式系统经典问题的解决以及优化的资,节点如发现已处理过则丢弃该请求另外标识号的,。 ,
源动态分配和资源恢复技术的成熟与网格技术, P2P 查惟一性使得应答消息可以原路返回给查询节点,。 必将结合起来以影响整个计算机网络的概念和人们 询节点收到应答后直接与目标节点建立网络连接, 。 的信息获取模式。另外节点对近期接收到的消息进行缓存以避免重复 ,
处理同样的消息搜索操作结束后发起搜索的节点 。 ,
会收到一些查询结果记录了满足条件的文件及其存 , 参考文献
殷晓春面向高师生的教育技术开放实验教学研究[1]. [D]. 请求节点可从中选择一些合适的节点放的节点 。 IP南京师范大学, 2006
谭义红陈治平林亚平基于网络拓扑和节点兴趣的[2],,. 来下载所需文件。
搜索机制计算机工程与
P2P . ,2008-6 的搜索机制可以看出个别节点失效对 Gnutella ,
杨舰对等网络有效搜索机制研究复旦大学[3]. [D]. ,2004 [4]查询结果影响较小能动态适应网络拓扑变化允许 ,,王文俊杨瑞娟梁文刚网络中一种层次资源搜索,,. P2P 节点动态加入或退出但是由于路由的不收敛性。 , , 模型空军雷达学院学报. ,2006-01 式的搜索又被称作盲目搜索或 Gnutella ,Blind Search)卢丽网络资源搜索模型的研究重庆大学[5]. P2P [D]. ,2007 随机搜索由于 的限制系统无法 (RandomS earch。) TTL
对整个网络进行有效的全面搜索所以这种搜索无法,
Research on Network Resource Search Engine
Based on P2P
CAI LI-bin , LIU Chao , ZHANG Hao
(Information Technology Ce, JniteujriangU niversty,i Jiujiang 332005)
, AbstractIntroduces the search mecanhism in unstructured peer-to -peer network anid ts working
principle. By analyzing its poor sca lability problem, in troduces the two key technologies (Cachng technology and the search amecnsmh of Gnutella)in detals. It optimizes thloea diii-
balancing among peers, and improthenves the scalability of network and the efficieonf cy
resourcesea rch.
Keywords, P2P, Gnutell,a Search Mecanhism, NetworkReso urce
趯趨2009.7M O D E R N C OM P U T E R