2008年(5645)
分类:
2008-04-28 14:19:22
关于网页的相似度问题,随着采集的大量涌现,互连网出现的大量相同的内容,如果一个站的内容,都是互连网上重复千百遍的内容,后果我想大家都明白,那就是搜萦引擎对该站的权重会降低,或直接K掉!
这里总结了几个小方法,既不高深
方法一:拆分法
把原有连续的文章,平均的截取成为2段3段或是更多。
好处:降低相似度、提高访问者浏览的速度、增加页面访问量
缺点:文章无法连续浏览,原有的一次性浏览变得繁琐,同时对Title标题的优化也有一定的不利,因为会有重复。不过数量较小的情况下不会有什么大碍。
方法二:跟随法
把每一个段落的结尾都增加一段话,可以是有情提示,小调查,或是其他文章的推荐。
好处:进一步降低相似度,给可以更多讯息,提供更多使用的功能。例如“回到最上面”
缺点:使用不当将降低用户体验,如果使用JAVASCEIPT等作有可能影响页面加载速度,干扰客户浏览主线。
方法三:标签法
在特定的关键字后增加友情注释。例如:我们所倡导的SEO(SEO相关信息)思想是......
好处:增加用户体验,让客户可以了解更多并不熟悉的专业名词,从而更好理解文章含义。 还可以自然的重复关键字,增加关键字密度。
缺点:如果使用过多,会造成页面信息繁乱,降低用户体验。增加页面体积,降低加载速度。干扰原有关键词布局和密度。
方法四:隐身法
将一些没有实际用处的词使用图片代替,经过优化的GIF图片只有十几个字节,将文章中出现的部分特定字或词进行隐身,也可以很好的达到降低页面相似度的效果。
优点:不干扰关键词布局、不干扰用户体验、不影响浏览和加载速度、有效防止被采集。
缺点:仅仅增加少许加载时间,但几乎可以省略不计。
这个方法其实也可以将各个网页的公共部分去掉,比如网站底部框架部分,公司信息之类,可以放到框架里边避免搜索引擎抓取。
关于网页的相似度问题,随着采集的大量涌现,互连网出现的大量相同的内容,如果一个站的内容,都是互连网上重复千百遍的内容,后果我想大家都明白,那就是搜萦引擎对该站的权重会降低,或直接K掉!
这里总结了几个小方法,既不高深
方法一:拆分法
把原有连续的文章,平均的截取成为2段3段或是更多。
好处:降低相似度、提高访问者浏览的速度、增加页面访问量
缺点:文章无法连续浏览,原有的一次性浏览变得繁琐,同时对Title标题的优化也有一定的不利,因为会有重复。不过数量较小的情况下不会有什么大碍。
方法二:跟随法
把每一个段落的结尾都增加一段话,可以是有情提示,小调查,或是其他文章的推荐。
好处:进一步降低相似度,给可以更多讯息,提供更多使用的功能。例如“回到最上面”
缺点:使用不当将降低用户体验,如果使用JAVASCEIPT等作有可能影响页面加载速度,干扰客户浏览主线。
方法三:标签法
在特定的关键字后增加友情注释。例如:我们所倡导的SEO(SEO相关信息)思想是......
好处:增加用户体验,让客户可以了解更多并不熟悉的专业名词,从而更好理解文章含义。 还可以自然的重复关键字,增加关键字密度。
缺点:如果使用过多,会造成页面信息繁乱,降低用户体验。增加页面体积,降低加载速度。干扰原有关键词布局和密度。
方法四:隐身法
将一些没有实际用处的词使用图片代替,经过优化的GIF图片只有十几个字节,将文章中出现的部分特定字或词进行隐身,也可以很好的达到降低页面相似度的效果。
优点:不干扰关键词布局、不干扰用户体验、不影响浏览和加载速度、有效防止被采集。
缺点:仅仅增加少许加载时间,但几乎可以省略不计。
这个方法其实也可以将各个网页的公共部分去掉,比如网站底部框架部分,公司信息之类,可以放到框架里边避免搜索引擎抓取。
下载本文示例代码