Chinaunix首页 | 论坛 | 博客
  • 博客访问: 7258692
  • 博文数量: 5645
  • 博客积分: 9880
  • 博客等级: 中将
  • 技术积分: 68080
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-28 13:35
文章分类

全部博文(5645)

文章存档

2008年(5645)

我的朋友

分类:

2008-04-28 14:19:22

下载本文示例代码

关于网页的相似度问题,随着采集的大量涌现,互连网出现的大量相同的内容,如果一个站的内容,都是互连网上重复千百遍的内容,后果我想大家都明白,那就是搜萦引擎对该站的权重会降低,或直接K掉!

这里总结了几个小方法,既不高深

方法一:拆分法

把原有连续的文章,平均的截取成为2段3段或是更多。

好处:降低相似度、提高访问者浏览的速度、增加页面访问量

缺点:文章无法连续浏览,原有的一次性浏览变得繁琐,同时对Title标题的优化也有一定的不利,因为会有重复。不过数量较小的情况下不会有什么大碍。

方法二:跟随法

把每一个段落的结尾都增加一段话,可以是有情提示,小调查,或是其他文章的推荐。

好处:进一步降低相似度,给可以更多讯息,提供更多使用的功能。例如“回到最上面”

缺点:使用不当将降低用户体验,如果使用JAVASCEIPT等作有可能影响页面加载速度,干扰客户浏览主线。

方法三:标签法

在特定的关键字后增加友情注释。例如:我们所倡导的SEO(SEO相关信息)思想是......

好处:增加用户体验,让客户可以了解更多并不熟悉的专业名词,从而更好理解文章含义。 还可以自然的重复关键字,增加关键字密度。

缺点:如果使用过多,会造成页面信息繁乱,降低用户体验。增加页面体积,降低加载速度。干扰原有关键词布局和密度。

方法四:隐身法

将一些没有实际用处的词使用图片代替,经过优化的GIF图片只有十几个字节,将文章中出现的部分特定字或词进行隐身,也可以很好的达到降低页面相似度的效果。

优点:不干扰关键词布局、不干扰用户体验、不影响浏览和加载速度、有效防止被采集。

缺点:仅仅增加少许加载时间,但几乎可以省略不计。

这个方法其实也可以将各个网页的公共部分去掉,比如网站底部框架部分,公司信息之类,可以放到框架里边避免搜索引擎抓取。

关于网页的相似度问题,随着采集的大量涌现,互连网出现的大量相同的内容,如果一个站的内容,都是互连网上重复千百遍的内容,后果我想大家都明白,那就是搜萦引擎对该站的权重会降低,或直接K掉!

这里总结了几个小方法,既不高深

方法一:拆分法

把原有连续的文章,平均的截取成为2段3段或是更多。

好处:降低相似度、提高访问者浏览的速度、增加页面访问量

缺点:文章无法连续浏览,原有的一次性浏览变得繁琐,同时对Title标题的优化也有一定的不利,因为会有重复。不过数量较小的情况下不会有什么大碍。

方法二:跟随法

把每一个段落的结尾都增加一段话,可以是有情提示,小调查,或是其他文章的推荐。

好处:进一步降低相似度,给可以更多讯息,提供更多使用的功能。例如“回到最上面”

缺点:使用不当将降低用户体验,如果使用JAVASCEIPT等作有可能影响页面加载速度,干扰客户浏览主线。

方法三:标签法

在特定的关键字后增加友情注释。例如:我们所倡导的SEO(SEO相关信息)思想是......

好处:增加用户体验,让客户可以了解更多并不熟悉的专业名词,从而更好理解文章含义。 还可以自然的重复关键字,增加关键字密度。

缺点:如果使用过多,会造成页面信息繁乱,降低用户体验。增加页面体积,降低加载速度。干扰原有关键词布局和密度。

方法四:隐身法

将一些没有实际用处的词使用图片代替,经过优化的GIF图片只有十几个字节,将文章中出现的部分特定字或词进行隐身,也可以很好的达到降低页面相似度的效果。

优点:不干扰关键词布局、不干扰用户体验、不影响浏览和加载速度、有效防止被采集。

缺点:仅仅增加少许加载时间,但几乎可以省略不计。

这个方法其实也可以将各个网页的公共部分去掉,比如网站底部框架部分,公司信息之类,可以放到框架里边避免搜索引擎抓取。

下载本文示例代码


合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?合理解决网页相似度的问题?
阅读(135) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~