google用的是什么数据库?-fatsandwich-ChinaUnix博客

sandwich vs Linux

首页　| 　博文目录　| 　关于我

fatsandwich

博客访问： 454412
博文数量： 161
博客积分： 5005
博客等级：上校
技术积分： 1090
用户组：普通用户
注册时间： 2008-10-20 16:38

文章分类

全部博文（161）

linux kernel（3）
other（1）
mac（6）
php（7）
linux基础知识（10）
数据处理（2）
网络技术应用（6）
IT业界（3）
script（4）

shell（4）
eclipse（3）
杂（5）
architecture（4）
everyday sandwic（9）
内核（4）
Android（4）
常识（6）
C/C++（3）

基础知识（3）
perl（1）
linux下编程（4）

小白问题（1）

函数使用备忘（1）

Qt（1）
python（11）

Django（2）
linux管理（14）

pure-ftpd（1）
Linux应用（15）

netshare（1）
MySQL（7）
JAVA（20）

Junit（5）

语法（1）

Spring（7）
GCC内嵌汇编（1）
VI（3）
未分配的博文（5）

文章存档

2011年（21）

2010年（33）

2009年（89）

2008年（18）

我的朋友

相关博文

google用的是什么数据库?

分类：服务器与存储

2009-03-25 03:54:23

google是用内存数据库；这样无论多少次的检索就都无需从硬盘缓存了
什么是google数据库呢?

以下是google其中的一个数据库:216.239.39.98。下面是Daniel Brandt对google数据库的一个定义：”就我所理解，google数据库是google在美国、欧洲甚至是印度等数据库的部分的复制。他们被用于引导平衡及可能“

数据库与更新

Andy Beal叙述了google更新及它与数据库之间的关系。 “在google更新它的主索引（）之前，它会首先在其它数据库中发生改变。这样就会通过一小部分的使用者用者得到新结果的测试结果，然后才把可用的结果返回到每一个使用者，这个过程一般会持续2-4天。”

为什么要观察这个数据库呢？

我问过那些经常观察数据库的专家为什么要这样做，他们做出了这样的答复：“他们密切地观察着数据库是由于在一年前，google的数据库中心还是可以预测的。google dance会首先在www2.google.com 与www3.google.com中更新反向链接，然后才在接下来的几天里把更新传到其他的数据库，新的反向链接暗示排名已经在整个数据库中被重新估算。一般是一个月作一次更新。”

“一旦新的同样的数据出现在www2、与www3中，排名将会变得稳定。因此，如果你观察这些数据库的话，你将会从这些新的索引中得到一些新的启发，从而会为你的网站在下次更新中做出相应的优化计划。”

所以，很多人会观察数据库，研究google的算法是否发生了新的变化。但是在上几个月，google的数据库变得不可预料了。
于google HILLtop算法的更新

----------------------------------
　
基于 Atul Gupta 的关于Hilltop算法的文章,我做了一些研究总结出这篇文章。Atul Gupta是 SEO Rank公司的CEO，正如他在文章上所说的。Hilltop算法在十一月16号的更新(号称佛罗里达更新)中起到了不可轻视的作用。

在我的有关google”佛罗里达更新的影响”的丛书里。在我较前的一篇文章里,我讨论了过度优化惩罚在一些网站上的体现，这些网站多是对某个关键字进行过度的优化。经过对hilltop算法的阅读与研究，我发现这个并不是一个新的算法，早在2001年已经出现了。

正如你所预料的，与以前的更新一样，google 对于依然保持一贯的沉默。所以，我的分析只是基于一些在google搜索引擎上的观察和测试。在深入研究这个算法是怎样影响到你在google排名之前，让我解释一下Hilltop算法为何物以及他的工作原理是什么。
这个对于你来说可能是一个搜索引擎全新的算法，我建议你去阅读有关google的page rank算法。

在最基本的排列中，google 的 page rank算法决定了一个网站的重要程度及最后的排名。根据这个原则，一个拥有100个链接的网站比一个只有10个链接的网站排名要高。在你考虑的时候这个原则将变得更有意义。

Hilltop 算法的定义：
与page rank 对比，google的Hilltop 算法决定了指定网页与搜索框里的搜索查询语句或者关键字的适当与重要程度。在基本、简单的排列中，取代了只依靠page rank的值去寻找那些权威的页面，当PR相同的两个描述同样主题的网站中的排名里，这个（hilltop）算法就显得非常的重要了。

通过这样的方法，计算来自描述相同主题的相关文档的链接对于搜索者的价值会更大（即相同主题网站之间的链接比不相关网站的链接价值要更大）。在 1999与2000年，当这个算法被Bharat与其他的google 人开发出来的时候，他们称这种相关的文档为“行家”（做相同主题）文档，而从这些行家文档链接到目标文档决定了他们的“得分的权威性”。再次强调，这个意义不大。

对于这个主题的一些更深入的信息，阅读由Bharat编写的一些文档，可以从多伦多计算机科学部得到。

利用Hilltop算法去定义相关性的网站

Google同样也利用这个算法去定义一个网站与另一个网站的相关性，实际上，Hilltop 算法在google 中作为一个检测杂交链接与相似链接的技术。
另处一方面要注意的，google 的Hilltop算法是基于行家文档的计算，正如以上描述的。

Hilltop算法要求，如果有两个相关的网站链接到你的网站，那么你的网站在搜索中出现的机会会更大。如果Hilltop算法不查找到最少两个相关性的网站，那么搜索返回的结果的机会绝对是0。Hilltop算法实际上是拒绝那些通过任意链接的方法来扰乱google的排名规则而得到较好排名的做法。

但是，在2004年Hilltop算法又是什么呢？

由于新的一年才刚开始，有些人可能会问：“这真的很cool，但是在“佛罗里达风暴”后，2004年将会有什么变化呢？”，这是一个很大的问题，而在过去的几个星期也有很多人发表了关于这方面主题的文章。

今天跟过去，很多搜索引擎停止了那种只使用一种有价值的算法去决定排名的做法。如keyword标签，meta tag等。这只是一个开始，google在第一步已经完全忽略meta 标签了。与meta相对照，一个网站的可视部分使用spam技术较在meta使用的要少，因为可视部分

阅读(825) | 评论(0) | 转发(0) |

上一篇：Spring 中整合Hibernate,编程式的事务管理

下一篇：（转）事务管理 Transaction Management

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6