TopN算法是一个经典的算法,由于每个map都只是实现了本地的TopN算法,而假设map有M个,在归约的阶段只有M x N个,这个结果是可以接受的并不会造成性能瓶颈。这个TopN算法在map阶段将使用TreeMap来实现排序,以到达可伸缩的目的。实现步骤: 1、在mapper中定义TreeMap 将输入数据按put到TreeMap中,如果TreeMap...【阅读全文】
Serverless 这个单词最早大约来源于Ken Form 的一篇文章中, 不过并不是今天我们要讨论的这个意思,如今的含义是无服务器,主要是指让开发人员专注于业务代码的本身逻辑上,无需关注代码部署的资源、维护、扩展性和高可用性,减少代码开发人员的业务无关的工作量,提高开发效率,具有无状态运行,基于事件触发,按需付费...【阅读全文】