Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1159685
  • 博文数量: 139
  • 博客积分: 2510
  • 博客等级: 少校
  • 技术积分: 1712
  • 用 户 组: 普通用户
  • 注册时间: 2006-03-13 23:10
个人简介

每天进步一点点。

文章分类

全部博文(139)

文章存档

2015年(3)

2014年(11)

2013年(25)

2011年(1)

2009年(3)

2008年(29)

2007年(45)

2006年(22)

分类: 系统运维

2007-07-19 17:45:50

GOOGLE搜索从入门到精通v2.2

一,GOOGLE简介

 

Google)是一个搜索引擎,由两个斯坦福大学博士生Larry PageSergey Brin19989月发明,Google Inc. 1999年创立。20007月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。

二,GOOGLE特色

 

GOOGLE支持多达132种语言,包括简体中文和繁体中文;

GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;

GOOGLE速度极快,据说有8000多台服务器,200多条T3级宽带;

GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;

GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;

GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;

GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。

三,基本搜索

 

GOOGLE的基本搜索语法:+-OR

GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。

示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页

搜索:“易筋经 吸星大法”

结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有988项查询结果,这是第1-10项。搜索用时0.30秒。

注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。

GOOGLE用减号“-”表示逻辑“非”操作。

示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页

搜索:“易筋经 -吸星大法”

结果:已搜索有关易筋经 -吸星大法的中文(简体)网页。共约有6,030项查询结果,这是第1-10项。搜索用时0.20秒。

注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 - 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“-”被忽略。

GOOGLE不支持关键字为中文的逻辑“或”查询,但支持英文关键字的“或”操作,语法是大写的“OR”。

示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。

搜索:“britney OR beatles

结果:已搜索有关beatles OR britney的中文(简体)网页。共约有19,800项查询结果,这是第1-10项。搜索用时0.35秒。

搜索:“布兰妮OR披头士”

结果:找不到和您的查询-布兰妮OR披头士-相符的网页。

+”和“-”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。

例:查阅天龙八部具体是哪八部。

分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。

1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。

2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 -金庸”。

四,辅助搜索

 

GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。

GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。

示例:搜索包含“long, long ago”字串的页面。

搜索:“”long, long ago”

结果:已向英特网搜索”long, long ago”. 共约有24,600项查询结果,这是第1-10项。搜索用时1.23秒。

注意:GOOGLE对中文句子作智能化处理,会自动把句子分割成词语作为关键词。比如,搜索包含“啊 我的太阳”这样句子,“ 我的太阳”,并没有搜到完全匹配的结果,但是,GOOGLE以“啊”、“我的”、“太阳”等词语为关键词,给出了符合诸如“啊,我的太阳”这样的结果。

GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“+”。

示例:搜索包含“Who am I ?”的网页。如果用“”who am i ?””,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。

搜索:“”+who am +i”

结果:已向英特网搜索”+who am +i”. 共约有310,000项查询结果,这是第1-10项。搜索用时0.30秒。

注意:英文符号无法成为搜索关键字,加强制也不行。

五,高级搜索

 

GOOGLE的常用高级搜索语法:sitelinkinurlallinurlintitleallintitle

site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。

示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。

搜索:“金庸site:edu.cn

结果:已搜索有关金庸site:edu.cn的中文(简体)网页。共约有3,780项查询结果,这是第1-10 。搜索用时0.31秒。

示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,

搜索:“金庸 古龙site:sina.com.cn

结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有722项查询结果,这是第1-10项。搜索用时0.34秒。

注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸site:edu.sina.com.cn/1/”的语法是错误的。

link”语法返回所有链接到某个URL地址的网页。

示例:搜索所有含指向华军软件园“”链接的网页。

搜索:“link:

结果:搜索有链接到的网页。共约有883项查询结果,这是第1-10项。搜索用时0.23秒。

注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。

inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。

搜索:“inurl:midi沧海一声笑”

结果:已搜索有关inurl:midi沧海一声笑的中文(简体)网页。共约有21项查询结果,这是第1-10项。搜索用时0.01秒。

示例:查找微软网站上关于windows2000的安全课题资料。

搜索:“inurl:security windows2000 site:microsoft.com

结果:已在microsoft.com内搜索有关inurl:security windows2000的网页。共约有234项查询结果,这是第1-10项。搜索用时0.37秒。

注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgi-bin/phf”中的“/”当成空格处理。

allinurl语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。

示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。

语法:“allinurl:”cgi-bin” phf +com

搜索:已向英特网搜索allinurl:”cgi-bin” phf +com. 共约有48项查询结果,这是第1-10项。搜索用时0.06秒。

allintitleintitle的用法类似于上面的allinurlinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言中</FONT></SPAN><SPAN style="FONT-FAMILY: 宋体; mso-ascii-font-family: Arial; mso-hansi-font-family: Arial">和</SPAN><SPAN lang=EN-US><FONT face=Arial>之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。

示例:查找日本明星藤原纪香的照片集。

搜索:“intitle:藤原纪香 写真”

结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有121项查询结果,这是第1-10项。搜索用时0.03秒。

阅读(1546) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~