Chinaunix首页 | 论坛 | 博客
  • 博客访问: 612000
  • 博文数量: 79
  • 博客积分: 848
  • 博客等级: 军士长
  • 技术积分: 1800
  • 用 户 组: 普通用户
  • 注册时间: 2012-06-26 19:30
文章分类

全部博文(79)

文章存档

2015年(4)

2013年(39)

2012年(36)

发布时间:2013-10-24 21:39:13

第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最.........【阅读全文】

阅读(2089) | 评论(0) | 转发(0)

发布时间:2013-10-20 19:41:29

一致性 hash 算法( consistenthashing ) 张亮 consistent hashing 算法早在 1997 年就在论文 Consistenthashing and random trees 中被提出,目前在 cache 系统中应用越来越广泛; 1 基本场景比如你有 N 个 cache 服务器(后面简称 cache ),那么如何将一个对象 object 映射到 N 个 cache 上呢,.........【阅读全文】

阅读(2657) | 评论(0) | 转发(1)

发布时间:2013-10-14 20:25:24

EPOLL事件分发系统可以运转在两种模式下:Edge Triggered (ET)、Level Triggered (LT)。LT是缺省的工作方式,并且同时支持block和no-blocksocket;在这种做法中,内核告诉你一个文件描述符是否就绪了,然后你可以对这个就绪的fd进行IO操作。如果你不作任何操作,内核还是会继续通知你的,所以,这种模式编程出错误可.........【阅读全文】

阅读(1550) | 评论(0) | 转发(0)

发布时间:2013-10-14 16:28:28

Select在Socket编程中还是比较重要的,可是对于初学Socket的人来说都不太爱用Select写程序,他们只是习惯写诸如 connect、accept、recv或recvfrom这样的阻塞程序(所谓阻塞方式block,顾名思义,就是进程或是线程执行到这些函数时必须等 待某个事件的发生,如果事件没有发生,进程或线程就被阻塞,函数不能立即返回)。 .........【阅读全文】

阅读(1413) | 评论(0) | 转发(0)

发布时间:2013-10-05 20:17:19

在这一个章节中,我们来追踪一下,用户提交了一个作业之后,如何从Mesos之中获取资源? 当然我们还是接着我上一中我们追踪到,FrameworkScheduler的代码,resourceOffers()函数点击(此处)折叠或打开public void resourceOffers(SchedulerDriver d, List offers) { .........【阅读全文】

阅读(3158) | 评论(0) | 转发(1)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册