海量数据处理概观-jian_g_-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

大海007 - 基础知识积累dahai007.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

博客访问： 489916
博文数量： 135
博客积分： 1860
博客等级：上尉
技术积分： 1441
用户组：普通用户
注册时间： 2008-01-05 20:39

文章分类

全部博文（135）

架构（0）
C++（3）
常用工具（3）
测试（2）
javascript（2）
算法与数据结构（4）
计算机原理（3）
海量数据处理（2）
linux c应用开发（22）
third-part libs/（4）
shell编程（20）
linux系统管理（48）
python2.6（19）
自我YY（1）
IDS snort实践（1）
网络原理（0）
未分配的博文（1）

文章存档

2012年（2）

2011年（130）

2009年（2）

2008年（1）

我的朋友

最近访客

推荐博文

海量数据处理概观

分类：

2011-08-11 17:04:40

下面的方法是我对海量数据的处理方法进行了一个一般性的总结，当然这些方法可能并不能完全覆盖所有的问题，但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目，方法不一定最优，如果你有更好的处理方法，欢迎与我讨论。

本贴从解决这类问题的方法入手，开辟一系列专题来解决海量数据问题。拟包含以下几个方面。

Bloom Filter
Hash
Bit-Map
堆
双层桶划分
数据库索引
倒排索引（Inverted Index）
外排序
Trie树
MapReduce

在这些解决方案之上，再借助一定的例子来剖析海量数据处理问题的解决方案。欢迎大家关注。

Pasted from <http://blog.redfox66.com/post/mass-data-topic-1-start.aspx>

阅读(966) | 评论(0) | 转发(0) |

0

上一篇：Bloom Filter概念和原理

下一篇：安装 subversion server

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们