Chinaunix首页 | 论坛 | 博客
  • 博客访问: 110449
  • 博文数量: 149
  • 博客积分: 325
  • 博客等级: 一等列兵
  • 技术积分: 1834
  • 用 户 组: 普通用户
  • 注册时间: 2012-07-18 16:24
文章分类
文章存档

2018年(1)

2015年(3)

2014年(86)

2013年(47)

2012年(12)

我的朋友

分类: 网络与安全

2012-07-23 16:26:50


上次,本人不才写了篇《你还在凭感觉解决网站收录吗》的文章,本来只是想写下自己解决收录问题的思路,最后发现这样根本行不通,被无数高手们批的是体无完肤啊。但是,正是因为如此,我才有了写更多的动力。其实,以前我写文章,下面评论的都是来打酱油的。这次看到有很多朋友拍砖,心里也踏实了,毕竟有人仔细看我的文章了。
今天,废话不说,直接进入主题:具体怎么解决网站收录问题。对于收录问题,我就列举一些常见的问题吧,然后一一提出决方法,虽然不敢保证每个网站按照此方法解决问题,但是至少操作得当效果还是有的,都知道seo是个细水长流的活。
一般收录问题也就是:网站每天都有收录,但是收录量不上升,有的甚至下降。还有的是就不收录,首页快照更新正常。对于这个问题,我建议是 得出的所有数据是用工具统计的,而不是靠百度 site: 得出的。因为大家都知道这个数据有多大的水分,百度统计、GA都可以。有数据才好说话。
百度的数据库确实问题很大,也总是清理大量垃圾或者说价值不大的信息。并不是说原创的就不删除,百度有个特点是,总是以网站来看网页的。权重高的站,什么都好说。这可苦了我们这些苦逼站长啊
收录量不增的问题,建议还是看看蜘蛛爬取了哪些目录,主要的目录爬取是否频繁。得出结论后,再分析蜘蛛对每个页面的抓取量。我就那个自己做优化的网站举例。网站主要目录就几个,企业站也就是这样。
从图中可以看见,和谷歌相比百度抓取的量实在很少。而有一两个目录是没有必要收录的,比如:联系地址、保存图片的目录等,自己感觉哪些重不重要。我当时的做法就是修改了robots.txt,禁止蜘蛛爬取不重要的目录。因为网站的权重不高,百度给的蜘蛛爬取量有限。缺点你懂的,百度蜘蛛有点傻,这个方法一般要等一个星期以后才会慢慢有点作用,还可能修改后收录会掉一些,过几天会恢复,robots文件都会写吧。如果不会,自己百度下,看看百科介绍的十分详细。这个是用robots.txt解决收录,还可以用nofollow标签。
网站首页站蜘蛛爬取量的很大一部分,而很多朋友在首页也加了不少链接到首页的链接。我的做法的,只保留第一个链接首页的链接。其他的都用nofollow标签限制,特别是“联系我们”这个导航栏。不管用robots文件还是nofollow标签,主要的思路还是引导蜘蛛爬行,因为百度蜘蛛还没有智能到像谷歌蜘蛛那样。
如果蜘蛛的爬行还是有了,还是不收录的话,那就只能说你的文章没有达到百度收录的标准,或者有点被惩罚了。我有个习惯就是,每次发一篇文章,都会为这篇文章做几个外链。举个例子:郑州seo,其实大型网站使用nofollow标签已经达到炉火纯青的地步了,大家可以去多特下载站,研究下人家对nofollow的使用技巧。
再告诉大家一个小技巧,日志里有蜘蛛对某个负面抓取量的数据。大家可以分析下这个负面为什么会那么受蜘蛛欢迎,不管是内容、结构、外链等等因素,都可以分析一下。列出一些数据,然后,就模仿这个负面,至于怎么模仿,大家应该知道吧
今天,很仓促,文章也没有什么条理性。我总是感觉这篇文章写有点多余,因为很多人都知道了。我上次写那篇文章的目的是要大家要养成个习惯:就是一切从数据出发,做到心中有数。不管怎样,文章还是写出来了,该批的继续批吧。
阅读(171) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~