从linux了解世界
发布时间:2016-11-10 14:44:20
10分钟学会理解和解决MySQL乱码问题http://cenalulu.github.io/mysql/mysql-mojibake/十分钟搞清字符集和字符编码http://cenalulu.github.io/linux/character-encoding/原博主是Facebook mysql dba,写的都很好:http://cenalulu.github.io/......【阅读全文】
发布时间:2016-09-23 09:55:14
大数据处理:(求最大的n个用小根堆,最小的n个用大根堆)使用mapreduce统计文章中单词出现个数,首先对文章预处理,去掉标点,对连字符-处理,对缩写处理,大小写转换。然后对每个单词进行hash映射,假设映射为10组,对每组中同一种单词进行合并,然后把每组的结果进行合并。对40亿的ip地址进行排序,每个ip只出现一次可.........【阅读全文】
发布时间:2016-08-28 19:24:48
解题思路:将数组排序之后,如果数组中有数出现的次数超过了一半,则一定是中间的那个数。其中排序过程要考虑有重复数字的情况,用堆排序快速排序都可以。判断中间的数是否超过一半有很多种方法,为了锻炼自己,使用二分查找(借鉴九章算法的二分模板)分别找到该数的最左面最右面,得到个数。主方法://快排(考虑重复数.........【阅读全文】
发布时间:2016-08-25 15:50:26
leetcode上看到了一个智商爆表的解法:public int countDigitOne(int n) { int ones = 0; for (long m = 1; m ......【阅读全文】
发布时间:2016-08-16 00:11:17
从大往小说:服务器结构层面1、首先是应用服务器和数据服务器分离2、应用服务器可以作为集群由一台或多台nginx服务器使用负载均衡共同管理,这其中涉及到应用服务器集群共享session等同步问题。多台nginx也可以由其他安装了负载均衡软件的机器管理。也就是三层结构:安装了负载均衡软件的机器(主要有两种常用的软件,忘.........【阅读全文】