Chinaunix首页 | 论坛 | 博客
  • 博客访问: 30058
  • 博文数量: 37
  • 博客积分: 335
  • 博客等级: 一等列兵
  • 技术积分: 480
  • 用 户 组: 普通用户
  • 注册时间: 2012-04-29 21:00
文章分类
文章存档

2014年(30)

2012年(7)

我的朋友

分类: 架构设计与优化

2014-03-15 10:32:01

    我们在去百度搜索信息的时候,百度搜索引擎并不是现查现找,而是搜索引擎早就把各类信息分类归档,每种分类的信息都有一个独立的资料库,而这个独立的资料库就是我们说的索引库,当我们去百度搜索某个词的时候,百度就自动调出属于这个词的索引库,在从这个索引库中调出对应信息呈现在用户面前,这个也是搜索引擎能够那么迅速从大量的信息库中调出对应信息的原因!知道了搜索引擎的索引库的原理,那么下面了解分词技术应该就不难了:


  通过上面的内容我们知道,要想建立索引库就必须把网页内的各个词分类归档,让相同分类的词处于同一个资料库,把网页内的词分类归档就是所谓的分词技术!我们知道,搜索引擎看网页跟我们看到的网页不一样,我们是看内容而搜索引擎看到的是源代码,搜索引擎先提取网站的源代码,然后搜索引擎又根据所看到的源代码把不同的词及链接分类到不同的资料库中去!
分词技术对于网站优化是有很大的意义的。

本文由__发布
阅读(112) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~