Chinaunix首页 | 论坛 | 博客
  • 博客访问: 34834
  • 博文数量: 16
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 604
  • 用 户 组: 普通用户
  • 注册时间: 2013-05-24 10:19
文章分类
文章存档

2013年(16)

我的朋友

分类: 数据库开发技术

2013-08-15 08:44:18

URL是一个重要的信息,职业敏感让分析师绝对不会忽略URL地址的特点。URL反映出网站的蛛丝马迹,直接以例子说话:

我爱好阅读网页时多个心眼。这个心眼需要察看很多元素,每个元素都能供给信息。孤破的一个元素不重要,然而多个元素组成的信息,往往能取得有价值的断定。那么从这些元素说起:

永远不疏忽URL


URL是一个主要的信息,职业敏感让分析师相对不会忽略URL地址的特色。URL反应出网站的蛛丝马迹,直接以例子谈话:


$URL地址所在的域名


良多人在网上被骗,很大起因就是素来不关注URL所在的域名。


比如:,看似弱智的骗术却让许多网友 误认为是淘宝的网站而落入骗局。这是ipx32域的网站,而不是taobao的网站。
在浏览的过程中,时辰关注页面的URL域名,可以明白点击链接是否分开本站,而关注新到的站点域名有何特点。在很多大客户的营销进程中,跨域的链接是很常 见的,不同的域象征着站长或广告主的监测工具与策略也会有所不同。

比方:在IT门户中常有Intel,华硕,HP等硬件厂商的专题页面(可能会增加Google Analytics或Nielsen的监测代码),这些页面中会有链接将拜访者导入新的域名,如intel_com_cn,或者hp_com_cn(可能 会增添Omniture、HBX或Webtrends的监测代码)。这种跨域的URL是不言而喻的。


$ URL地址所包括的参数


URL中包含参数是再常见不外了,但每个参数都有含意,关注它们可能全面把握网站的功能特点。比如:


这是Sidney的新博客的地址,可以分析这个博客经营了挺长的一段工夫了,ID号都排到917了。

这是QQ首页的右侧广告链接,里面丰盛的参数告知了咱们对这些广告位的名称定义,,以及跳转的目的地址。

这是腾讯搜搜的“WA”成果页,告诉我们搜索要害词参数是用W变量。还有一些别的参数,兴许一下子看不懂,假如有须要可再屡次实验研讨,就能够断定。


总之,对URL的参数关注是剖析师的基础功。


$ URL地址所指向的文件类型


URL中会包含文件类型的信息。


HTML/HTM:这阐明这种网站的页面是经由静态化处理的,以便利搜寻引擎抓取。当初大局部门户与CMS系 统都会有静态化处置功效。再有一些简朴的个人网页也会运用html文件名。

JSP/PHP/ASPX/ASP:这说明这是一种动态页面,网页源文件是存在服务器端,这些文件的特征可自 行搜索懂得。

无类型:有些地址,,这是属于服务器 自定义了主页,后果实在是/index.php

.do: 这种情况是jsp开发的网站。其实不需要完整知道,能帮助即可。这种网站个别有肯定的技巧含量,但技术实力不强,不够进步,常见于一些国资背景企业的功能 型网页,或者网站的后盾。由于时下好的网站,在前端页面都能将URL暗藏得很好,不会呈现.do这种情形。

另外:还有一些开源项目标网站URL地址比拟特殊,如Wordpress:/index.php/excellent-analytics/; 或 Wikipedia:首页。


$ URL地址命名的特征


从URL的命名也能发明蹊跷或有趣的事,好比:

 


淘宝的URL特征就很有意思,是通过base 64编码的。(感激money的指导,修改本来过错,很有播种,再次解释URL里有乾坤),很 多“-”。我揣测“–”之间代表着变量,如果旁边没有值,就代表这个变量没有定义。

凡客诚品的URL也很有特点:
, 产品拼音+色彩。

另外还能找出他们员工马虎之处:我们知道中文括号()与英文括号()不同,URL地址中只能涌现英文括号,中文括号会翻译成编码。可见Vancl 的员工在产品录入时不同一尺度:
%EF%BC%88ZunGuiKuan%EF%BC%89.html
(BiaoZhunKuan).html


网页源文件


对好奇的网页,肯定要查看网页源文件。通过源文件的疾速浏览可以肯定网站的技术实力、设想职员的素质,监测工具与监测方式的部署情况。普通关注以 下四点:


代码是否清洁仍是冗烦

安排了哪些监测工具

监测工具的代码部署的地位与次序

是否参加了可疑代码


上附近通:
其它文章
阅读(401) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~