Chinaunix首页 | 论坛 | 博客
  • 博客访问: 32304
  • 博文数量: 29
  • 博客积分: 225
  • 博客等级: 二等列兵
  • 技术积分: 400
  • 用 户 组: 普通用户
  • 注册时间: 2012-10-18 14:36
文章分类
文章存档

2016年(2)

2015年(1)

2014年(5)

2013年(14)

2012年(7)

我的朋友

分类: 架构设计与优化

2013-05-24 11:49:02

 最近发现一些关键字在谷歌的搜索结果中排名非常靠前,可是本博客的Pagerank=0,有时连0都没有。可是Google为什么会注意到这点呢?比如:当你搜索”Google ufo 麦田圈”时,易IT博客的文章 Google放出第二个UFO Logo - 易IT博客就排名第一。具体见下图:


前几天,Search Engline Journalde Ann Smarty也发现了这个问题,她的文章里讲到那些排名靠前的小站点或新站点的网页甚至连都做的不好。在Webmasterworld的贴子解释到,这是一种“混合”的搜索方式。排名最靠前的搜索结果是混合不同搜索结果的“集簇”后给出的,目的是为了给用户更多的选择。
这种混合可能包括以下几种形式:
强制较新鲜的搜索结果排名靠前
综合导航类的网页、信息类和事务类的网页
综合对同一个关键词有不同解释的网页
综合各种类型搜索的结果,比如本地搜索,产品搜索,图片搜索和新闻搜索等
。。。Google有时强制从有不同意思和意义的网页集合中拿来某些网页放到搜索结果的第一页,即使有时这些网页的排名不是很高。。。
一点补充,几年前有段时间Google在改进技术强制把某些搜索结果放在固定的位置
以上的理论是基于Google的专利“在搜索短语的搜索结果中自动产生分类”,这个专利描述了下面的算法:
搜索结果可以混合不同集簇的代表性结果
一个用来查询的短语可能会与几个网页的集簇相关联。每个集簇是一组可能包含其他不同短语作为关键字的网页,是作为当前查询短语结果的补充。这假设创建集簇的短语是由一组提供被专利称为“信息增益”的单词的组合。
看来每个搜索引擎都有这样一种机制,只是收录的速度、更新的快慢和具体的算法不同。
另外一个现象就是,我猜想Google多数时候会根据搜索结果生成的时间来判断哪个是最初的源,而最早产生的重复内容会排名靠前。而百度则可能会把网站的排名作为主要考虑的因素。比如,相同一篇博客,原创的一般会在google的搜索结果中靠前,而在百度,排名高网站

阅读(189) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~