Chinaunix首页 | 论坛 | 博客
  • 博客访问: 69909
  • 博文数量: 29
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 272
  • 用 户 组: 普通用户
  • 注册时间: 2015-01-05 20:32
文章分类

全部博文(29)

文章存档

2016年(2)

2015年(27)

我的朋友

发布时间:2016-06-04 11:23:52

spark streaming以flume为数据源(pull模式)是可以保证不丢数据的,但是经测试发现如果spark streaming挂掉的话,channel中存如太多的数据会导致flume启动慢的问题。......【阅读全文】

阅读(1358) | 评论(1) | 转发(0)

发布时间:2016-06-04 11:11:21

在运用kafka时要不要动态增加consumer以及consumer的线程数,读learning apache kafka终于有了一点思路......【阅读全文】

阅读(1096) | 评论(0) | 转发(0)

发布时间:2015-04-12 14:51:24

R的数据读取一直是个问题(我一直read.table, read.csv,超慢!!!)今看到R-blogger关于R读数据神器的推荐,自已就测试了一下readr中的read_table函数,下面是测试结果引用:file:///D:/programe%20files/tmp/M3-1-656/tmpmail~1.htmlHadley Wickham and the RStudio team have created some new package.........【阅读全文】

阅读(5962) | 评论(0) | 转发(0)

发布时间:2015-04-08 20:28:00

接解R这么久,给我的感觉就是R根本不关心内存的问题。也可能是R更多的关心的是方法,下面是一点关于R内存机制方面的总结。首先加载安装pryr包a = 1; address(a)           查看a的地址e = nev.env()              创建一个新空间e$a =2     &.........【阅读全文】

阅读(1118) | 评论(0) | 转发(0)

发布时间:2015-04-08 19:31:53

相对于其它语言,R是易学的,因为它提供的帮助文档非常的丰富(用习惯R后,刚用python时,就很不习惯它的帮助文档)以下是看别人文章结合自已的经验写的一点R帮助文档的东东。函  数                                    .........【阅读全文】

阅读(2315) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册