发布时间:2016-06-04 11:23:52
spark streaming以flume为数据源(pull模式)是可以保证不丢数据的,但是经测试发现如果spark streaming挂掉的话,channel中存如太多的数据会导致flume启动慢的问题。......【阅读全文】
发布时间:2016-06-04 11:11:21
在运用kafka时要不要动态增加consumer以及consumer的线程数,读learning apache kafka终于有了一点思路......【阅读全文】
发布时间:2015-04-12 14:51:24
R的数据读取一直是个问题(我一直read.table, read.csv,超慢!!!)今看到R-blogger关于R读数据神器的推荐,自已就测试了一下readr中的read_table函数,下面是测试结果引用:file:///D:/programe%20files/tmp/M3-1-656/tmpmail~1.htmlHadley Wickham and the RStudio team have created some new package.........【阅读全文】
发布时间:2015-04-08 19:31:53
相对于其它语言,R是易学的,因为它提供的帮助文档非常的丰富(用习惯R后,刚用python时,就很不习惯它的帮助文档)以下是看别人文章结合自已的经验写的一点R帮助文档的东东。函 数 .........【阅读全文】