Chinaunix首页 | 论坛 | 博客
  • 博客访问: 258097
  • 博文数量: 313
  • 博客积分: 5000
  • 博客等级: 大校
  • 技术积分: 3530
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-22 16:19
文章分类

全部博文(313)

文章存档

2011年(30)

2010年(170)

2009年(84)

2008年(29)

我的朋友

分类:

2009-09-12 14:44:24

我们作为站长的每天要做的就是给网站更新内容,更新内容的同时也在不段的总结,如何能省时省事又快又好的更新网站内容。今天我们就用我的采集之路破灭,来谈谈采集内容的一些弊端。

  一. 显示内容过滤不完

  为什么说采集内容快,质量不高。因为现在的站长不在是以前的站长了,你用程序化的采集内容,内容中的关键字你是过滤不完的,有一些不利的外链可以说是数不胜数。

  更重要的一点,如果是采集,文章中的一些不良语,程序是根本不能完全过滤的,你可能要抱侥幸心理,我采集的都是名站大站,他们站上不可能有不良的词句的。话可不能这么说,人家正因为是大站名站,可能有一些词句在人家站上放起就没事,在你的小站上放可能就有事,就有可能你打开谷歌快照缓存的时候,给你说你的网站有不良词语,不能显示。


  二. 暗语同样过滤不完

  如果我们用程序化去采集,文章中出现的一些暗链,暗语,你是过滤不完的,过多的垃圾语句,无用语句,你也一字母不少的给采集到你的网站,很不利用各大搜索引擎的收录。

  三. 图片采集过滤不严

  如果你想用程序来完全过滤,图片中的不良画面,我想那是不现实的,在说现在也没有那一个程序或软件能完全过滤不良画面。就连百度都做不到,何况我们呢。最重要的一点,网站一旦出现某些不良图片,你的空间商随时可能关你空间,网警随时可能把你抓去关两天。我们做网站可不想到那一天。在说不良图片采集到你的空间上去,也浪费空间。过多的图片显示,也拖你网站整体打开的速度

  四. 采集内容搜索引擎不爱收录

  为什么这么说,大家想想网上有很多相同内容的页面了,你说聪明的搜索引擎还有必要收录你的小站吗。是用程序采集来更新内容,刚开始它们还是很领情,每天更新的大多数内容都给我收录了,可是好景不长,这不还不到百度大更新的时候,就一下给我减少了四分之一的收录量,不知百度大更新时,会不会一下全部给我清除了。

  综上所述,我们每天更新网站的时候,不要去采集,最好是一个一个的审核,做到更新一个内容,百度谷歌收录一个,能不上的最好不上,以免浪费空间。

阅读(244) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~