关于搜索引擎技术普及的主题,第二次我们选择来跟大家谈一谈链接结构分析技术。超链接结构信息是网络信息环境与传统信息媒介的最大区别之一,与用户查询需求乃至页面内容均相对独立的超链接结构,是搜索引擎区别于传统信息检索系统的核心所在。
如果说Web信息资源是一部包罗万象的百科全书,那么链接结构信息就是这部百科全书的目录,我们面临的看似无序繁杂的网络信息资源,如果没有链接结构信息作为组织的媒介的话,将很难被用户充分利用。
自从1998年Google将其PageRank算法的一些内容在学术论文中加以公布后,研究界、产业界和搜索引擎技术爱好者对链接分析技术的热忱就没有终止过。在介绍详细的算法流程之前,我们想换一个角度首先对链接分析能够成立的几个基础假设进行一个介绍。
1. 什么是超链接
超链接是指两个网页或网页的两个不同部分之间的一种指向关系,源网页是指包含超链接的网页,超链接一般在源网页HTML源码中表现成如下的文字形式:
管理员在2009年8月13日编辑了该文章文章。
阅读(673) | 评论(0) | 转发(0) |