Chinaunix首页 | 论坛 | 博客
  • 博客访问: 267600
  • 博文数量: 60
  • 博客积分: 5015
  • 博客等级: 大校
  • 技术积分: 630
  • 用 户 组: 普通用户
  • 注册时间: 2007-03-07 14:07
文章分类

全部博文(60)

文章存档

2016年(1)

2014年(1)

2011年(1)

2010年(4)

2007年(53)

我的朋友

分类: 系统运维

2007-05-05 15:34:24

谁不想自己的网站在Google的搜索结果重排名靠前呢,但你的网站设计是Search Engine Ready的吗?本文介绍了网站设计中面向搜索引擎的优化注意事项。
什么是PageRank

Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最好的结果排在搜索结果的最前面,具体的原理可以参考一文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。在互联网上PageRank就是基于网页中相互链接关系的分析得出的,由此引出第一个要点:

链接就是一切

在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。“酒好也怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事实就是这样。所以如果做网站的目的不是孤芳自赏,就需要积极的推广自己的网站。

Blogger(Weblog简称Blog)们也许最深刻的理解了这句话的含义,Blogger之间有大量相互链接,因此最经常被引用的页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。

在推广自己网站之前也许首先需要自己网站在一些搜索引擎中的知名度,有一个小工具:原理可以参考:如何评价网站的人气一文。

例子1:不一定加入大型网站的分类目录才是网站推广,来自其他网站的任何反相链接都是有用的。
网站推广比较经典的方式就是加入比较大型网站的分类目录,比如:,等。其实这里有一个误区:不一定非要从大型网站的分类目录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网页索引,所以无论来自大网站任何地方的反相链接都是非常有价值的,只要是出现在新闻报道,论坛,邮件列表归档,关键是要多,而且是权重高的高层页面,我的网站没有加入任何分类目录,而是将一些文章投稿在了上,相应网页和网站整体的PageRank过了一段时间后就有了很大的提升。

例子2:被PageRank高的网站引用能更快地提高PageRank。
被什么样的网站引用有时候比引用次数多更重要,我的文章被ZDNet中国引用以后,相应网页的权重升高非常快。这里我要特别感谢的是,是唯一遵循了我的版权声明的要求表明了文章出处,并且有反相链接的网站。

例子3:投搜索引擎所“好”
这篇文章被引用以后,这篇文章就成为了所有页面中PageRank最高的页面(在上显示是6/10),而Google深厚的学院气氛让我一直怀疑他们对.org .edu等非功利站点有特别加分 :-)。

   

网站推广只是手段,如何突出内容,让需要相关信息的用户能够尽快的找到你的网站才是目的,第二个要点:

标题和关键词的重要性
  1. 不要空着标题:空着
    传统的页面中,会有类似以下的信息:用于说明网页的主题



    后来由于这种人工添加关键词的方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关的热门关键比如:“music mp3 download”等,所以新的搜索引擎已经不再关心页面头文件中的meta keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中有着更高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而在相应的搜索结果排名中更靠前。
  2. 标题长度:不要过长,一般在40个字符以内;如果更长的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。
  3. 标题内容:尽量用一些别人可以通过关键词找到的字眼;"Website search engine optimization" 会比"面向搜索引擎的网站设计优化"有效的多。
  4. 如果网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范围;
    我的猜测:搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;
    是我的网站上的一个小应用:一个web界面的unix命令手册(man page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man page /perldoc /info page web interface" ,Google索引了大约3000多个页面,后来我将页面标题改成了"phpMan:  [命令名]"这样的格式,比如:"phpMan: ls",这样大部分动态页面的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网站中很多网页都使用相同的标题,比如:“新闻”,“论坛”,这些页面中很大一部分就会被排重机制忽略掉。
  5. 除了外,还可以用

    标题行突出内容主题,加强标题的效果;
    在我的网站设计中:我会把用

    [标题]

    这样的模板把标题突出显示,而不是通过改变字体的方式突出标题。
其他网站设计提示
  1. 表现和内容的分离:
    网页中的javascript和css尽可能和网页分离,一方面提高代码重用度(也方便页面缓存),另外一方面,由于有效内容占网页长度的百分比高,也能提高相关关键词在页面中的比重,应该鼓励使用更规范的XHTML和XML作为显示格式便于内容更长时间的保存。
  2. 站点地图:让所有的页面都有能够快速入口,方便网页爬虫(spider)快速遍历网站所有需要发布的内容。提高网站自身的健康状态:经常利用坏链检查工具(比如:)生成网站地图统计,并检查网站中是否有死链。
  3. 尽可能保持网页的持久性,保证引用你的网页能够被比较持久的稳定引用,如果网页中有链接更新时,最好能保留旧的页面并做好链接转向,保持内容的连续性。
知己知彼——站点访问统计/日志分析挖掘的重要性

    网站设计不仅仅只是被动的迎合搜索引擎的索引,更重要是充分利用搜索引擎带来的流量进行更深层次的用户行为分析。目前,搜索引擎关键词统计几乎是各种日志分析工具的标准功能,日志统计这个功能如此重要,以至于新的RedHat 8中已经将日志分析工具webalizer作为标准的服务器配置应用之一。相信商业日志统计工具在这方面应该会有更强化的实现。

以Apache/webalizer为例,具体的做法如下:

  1. 记录访问来源:
    在Apache配置文件中设置日志格式为combined格式,这样的日志中会包含扩展信息:其中有一个字段就是相应访问的转向来源:HTTP_REFERER,如果用户是从某个搜索引擎的搜索结果中找到了你的网页并点击过来,日志中记录的HTTP_REFERERL就是用户在搜索引擎结果页面的URL,这个URL中包含了用户查询的关键词。
  2. 在webalizer中缺省配置针对搜索引擎的统计:如何提取HTTP_REFERER中的关键词
    webalizer中缺省有针对yahoo, google等国际流行搜索引擎的查询格式:
    SearchEngine yahoo.com p=
    SearchEngine altavista.com q=
    SearchEngine google.com q=

    通过这样设置webalizer统计时就会将HTTP_REFERER中来自搜索引擎的URL中的keyword提取出来,比如:所有来自google.com链接中,参数q的值都将被作为关键词统计下来,从汇总统计结果中,就可以发现用户是根据什么关键词找到你的次数,以及找到你的用户最感兴趣的是那些关键词等,进步的,在webalizer中有设置还可以将统计结果倒出成CSV格式的日志,便于以后导入数据库进行历史统计,做更深层次的数据挖掘等。

    以前通过日志的用户分析主要是简单的基于日志中的访问时间/IP地址来源等,很明显,基于搜索引擎关键词的统计能得到的分析结果更丰富、更直观。因此,搜索引擎服务的潜在商业价值几乎是不言而喻的,也许这也是Yahoo! Altavista等传统搜索引擎网站在门户模式后重新开始重视搜索引擎市场的原因,相信以后会有更多的利用互联网媒体做深层次数据挖掘的服务模式出现。

阅读(821) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~