Chinaunix首页 | 论坛 | 博客
  • 博客访问: 16075276
  • 博文数量: 5645
  • 博客积分: 9880
  • 博客等级: 中将
  • 技术积分: 68081
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-28 13:35
文章分类

全部博文(5645)

文章存档

2008年(5645)

我的朋友

分类:

2008-04-28 14:19:07

下载本文示例代码

1、提交sitemap即意味着google将会索引、收录网页

  时常可以看到不少朋友在论坛中询问诸如“我已提交了Sitemaps,为什么Google还未收录我的网页啊?”之类的问题,似乎在其潜意识里,只要在sitemaps中提交了相应网页,Google便应该将其收录。

  这是很荒唐的理解,从最基本的角度,Sitemaps只是google向网站管理员提供的一个工具,尽管可以说是一个非常重要、有效的工具,但其只是对Google的索引收录过程起一定的辅助作用,而决定Google是否会索引网站/网页的最主要因素则在于Google对网站的信任度及网站是否具有良好的可索引架构等。

  从这个意义上说,绝不能将Google Sitemaps理解成Google的“后门”——当然,这里的“后门”则是指一般意义上的后门,而不是我们那篇文章中的意思——尽管Sitemaps能够帮助Google及时发现新的内容,提高Google 爬行与索引的效率,但它与Google是否一定会收录或索引之间没有什么必然的联系。

  比如说,如果Google对某个网站的信任指数较低,那么,其对该网站爬行索引的广度与深度都存在很大限制(参见Matt Cutts的 Indexing Timelines),其Spider便不会在网站内充分索引,提交Sitemaps并不能改变这个由算法决定的选择机制,即使Google通过 Sitemaps得到了网站内新网页的URL,其同样不会去索引那些页面。

  2、Sitemap中的网页,或早或晚,都会被google收录

  这种想法的谬误之处在上文已经涉及到部分,但是,就算网页具有良好的导航架构,就算网站获得了比较高的Google信任指数,也不能保证Sitemaps 中的URL都会被Google收录。

  另一个重要因素在于,网站/网页则否对Spider友善,在很多时候,不要奢望Spider具有坚韧不拔专啃硬骨头的“革命精神”,相反地,其有着“知难而退”的坏习惯,对于Sitemaps中其难以辨识或根本无法辨识的URL,是根本没有兴趣爬行的。

  这就要求网站建设者以搜索引擎Spider的视角设计网页,尽量避免在网页链接中使用对Spider不友好的元素,比如说包含在Framesets中的URL对Spider而言是极其难以阅读的,而JavaScipt中的URL则根本就是Spider看不到的等。

  3、Sitemaps中应包含网站的全部内容

  许多朋友在生成Sitemaps时,总怕有所遗漏,总想在Sitemaps包涵网站内的全部文件,结果,提交的Sitemaps往往十分庞大,不仅包括网页URL,也包括网页中的图片、flash等等,事实上,这对Google的索引与收录包括对网站最终的SEO效果,均没有太大的实际意义,而且,过大的Sitemaps文件也是对服务器带宽的巨大浪费,增加服务器的负担。

  当然,这并不是说在Sitemaps中不应该包含图片文件,如果希望在Google图片搜索中获益,希望优化Google图片搜索,在 Sitemaps中加入图片文件也许会有所帮助——老实说,本人并不这么认为,不过,因未有明确证据,在此不敢断言——不过,相比较而言,对图片搜索来说,为图片设置恰当的“alt” tag,使用有意义的文件名会有效得多。反观一些朋友Sitemaps中的图片文件URL,却仍在使用如“1234567.gif”之类的文件名,这恐怕并不是一个好的选择。

  至于在Sitemaps中包含被robots.txt排除在外的网页或使用“meta NOINDEX”的网页URL,则更属无意义之举了。

  4、使用Google sitemap能提高网站/网页在SERP中的排名(或提高SEO效果)

  Sitemaps只是在一定程度上提高网站页面被收录、索引的效率,从这个意义上说,对网站的整体SEO效果当然是有所助益的。

  但是,Sitemaps与网站/网页最终出现在SERP中的排名则没有任何直接意义上的联系,这是两个虽有联系但实现过程中交叉部分很少的两个机制。——当然,如果非要强辩说,随着网站内页面收录数量增加,站内的交叉链接权值会相应提高,而这会对最终的排名产生影响,倒也能在某种程度上说得过去,不过,影响多大就难说了。

  5、新网站可通过Google sitemap走出Sandbox

  所谓Sandbox,是Google基于新网站信任度不够的体现,当然,其中时间因素是一个重要的考量。

  要尽快走出Sandbox,只能通过权威性的相关链接与高质量的网页内容来达成,Sitemaps对其无能为力。

  6、在Sitemaps中设定某个URL高优先度可以提高其PageRank(或SERP排名)

  呵呵,本来想写够五项误区就罢手的,不过,错误理解优先度(Priority)概念的情况实在太普遍了,常常可以许多人的言谈中看到类似的误解。——同样的情况还包括,如在Sitemaps中将所有Url都设置成高优先度,夸张的是某位朋友的Sitemaps中,所有URL的Priority 全为1。

  首先需要明确的是,Sitemaps中的优先度,只是相对于同一网站内的其他网页URL而言的,也即是说,比较A网站Priority=0.1 的URL与B网站Priority=1的URL哪个更优先没有任何意义;其次,优先度只是告诉Google,网站建设者认为网站内哪个网页更重要,这样,在同一网站内存在多个待索引网页时,Google的Robots才会根据优先度的不同,听从网站建设者的“建议”,先去索引高优先度的网页。——当然,在对搜索结果进行排序时,Google则有自己的主见,是不会受网站建设者所左右的。

  因此,优先度的意义只体现在可以帮助网站建设者实现让网站内的重要页面尽可能地被Google收录,或者,先被Google收录,与网页的PageRank无关,当然更与最终SERP中的排名无关。

1、提交sitemap即意味着google将会索引、收录网页

  时常可以看到不少朋友在论坛中询问诸如“我已提交了Sitemaps,为什么Google还未收录我的网页啊?”之类的问题,似乎在其潜意识里,只要在sitemaps中提交了相应网页,Google便应该将其收录。

  这是很荒唐的理解,从最基本的角度,Sitemaps只是google向网站管理员提供的一个工具,尽管可以说是一个非常重要、有效的工具,但其只是对Google的索引收录过程起一定的辅助作用,而决定Google是否会索引网站/网页的最主要因素则在于Google对网站的信任度及网站是否具有良好的可索引架构等。

  从这个意义上说,绝不能将Google Sitemaps理解成Google的“后门”——当然,这里的“后门”则是指一般意义上的后门,而不是我们那篇文章中的意思——尽管Sitemaps能够帮助Google及时发现新的内容,提高Google 爬行与索引的效率,但它与Google是否一定会收录或索引之间没有什么必然的联系。

  比如说,如果Google对某个网站的信任指数较低,那么,其对该网站爬行索引的广度与深度都存在很大限制(参见Matt Cutts的 Indexing Timelines),其Spider便不会在网站内充分索引,提交Sitemaps并不能改变这个由算法决定的选择机制,即使Google通过 Sitemaps得到了网站内新网页的URL,其同样不会去索引那些页面。

  2、Sitemap中的网页,或早或晚,都会被google收录

  这种想法的谬误之处在上文已经涉及到部分,但是,就算网页具有良好的导航架构,就算网站获得了比较高的Google信任指数,也不能保证Sitemaps 中的URL都会被Google收录。

  另一个重要因素在于,网站/网页则否对Spider友善,在很多时候,不要奢望Spider具有坚韧不拔专啃硬骨头的“革命精神”,相反地,其有着“知难而退”的坏习惯,对于Sitemaps中其难以辨识或根本无法辨识的URL,是根本没有兴趣爬行的。

  这就要求网站建设者以搜索引擎Spider的视角设计网页,尽量避免在网页链接中使用对Spider不友好的元素,比如说包含在Framesets中的URL对Spider而言是极其难以阅读的,而JavaScipt中的URL则根本就是Spider看不到的等。

  3、Sitemaps中应包含网站的全部内容

  许多朋友在生成Sitemaps时,总怕有所遗漏,总想在Sitemaps包涵网站内的全部文件,结果,提交的Sitemaps往往十分庞大,不仅包括网页URL,也包括网页中的图片、flash等等,事实上,这对Google的索引与收录包括对网站最终的SEO效果,均没有太大的实际意义,而且,过大的Sitemaps文件也是对服务器带宽的巨大浪费,增加服务器的负担。

  当然,这并不是说在Sitemaps中不应该包含图片文件,如果希望在Google图片搜索中获益,希望优化Google图片搜索,在 Sitemaps中加入图片文件也许会有所帮助——老实说,本人并不这么认为,不过,因未有明确证据,在此不敢断言——不过,相比较而言,对图片搜索来说,为图片设置恰当的“alt” tag,使用有意义的文件名会有效得多。反观一些朋友Sitemaps中的图片文件URL,却仍在使用如“1234567.gif”之类的文件名,这恐怕并不是一个好的选择。

  至于在Sitemaps中包含被robots.txt排除在外的网页或使用“meta NOINDEX”的网页URL,则更属无意义之举了。

  4、使用Google sitemap能提高网站/网页在SERP中的排名(或提高SEO效果)

  Sitemaps只是在一定程度上提高网站页面被收录、索引的效率,从这个意义上说,对网站的整体SEO效果当然是有所助益的。

  但是,Sitemaps与网站/网页最终出现在SERP中的排名则没有任何直接意义上的联系,这是两个虽有联系但实现过程中交叉部分很少的两个机制。——当然,如果非要强辩说,随着网站内页面收录数量增加,站内的交叉链接权值会相应提高,而这会对最终的排名产生影响,倒也能在某种程度上说得过去,不过,影响多大就难说了。

  5、新网站可通过Google sitemap走出Sandbox

  所谓Sandbox,是Google基于新网站信任度不够的体现,当然,其中时间因素是一个重要的考量。

  要尽快走出Sandbox,只能通过权威性的相关链接与高质量的网页内容来达成,Sitemaps对其无能为力。

  6、在Sitemaps中设定某个URL高优先度可以提高其PageRank(或SERP排名)

  呵呵,本来想写够五项误区就罢手的,不过,错误理解优先度(Priority)概念的情况实在太普遍了,常常可以许多人的言谈中看到类似的误解。——同样的情况还包括,如在Sitemaps中将所有Url都设置成高优先度,夸张的是某位朋友的Sitemaps中,所有URL的Priority 全为1。

  首先需要明确的是,Sitemaps中的优先度,只是相对于同一网站内的其他网页URL而言的,也即是说,比较A网站Priority=0.1 的URL与B网站Priority=1的URL哪个更优先没有任何意义;其次,优先度只是告诉Google,网站建设者认为网站内哪个网页更重要,这样,在同一网站内存在多个待索引网页时,Google的Robots才会根据优先度的不同,听从网站建设者的“建议”,先去索引高优先度的网页。——当然,在对搜索结果进行排序时,Google则有自己的主见,是不会受网站建设者所左右的。

  因此,优先度的意义只体现在可以帮助网站建设者实现让网站内的重要页面尽可能地被Google收录,或者,先被Google收录,与网页的PageRank无关,当然更与最终SERP中的排名无关。

下载本文示例代码


向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区向google提交网站地图Sitemaps 的误区
阅读(303) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~