Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1360457
  • 博文数量: 209
  • 博客积分: 464
  • 博客等级: 下士
  • 技术积分: 3762
  • 用 户 组: 普通用户
  • 注册时间: 2011-01-24 18:25
  • 认证徽章:
个人简介

阿弥陀佛

文章分类

全部博文(209)

文章存档

2019年(3)

2018年(5)

2017年(6)

2016年(10)

2015年(9)

2014年(73)

2013年(90)

2012年(13)

发布时间:2014-12-20 11:41:51

看了一下 The rsync algorithm这个算法,知道了远程同步两个文件的原理。问题:A电脑上有文件a,B电脑上有文件b,当b文件被修改的时候,如何快速的将数据同步到a文件中。核心步骤分三步:1. 计算分片哈希2. 比对两个文件的分片哈希3. 通过数据压缩算法传修改过的数据。将数据分成块,然后分别计算出一个32bit的che.........【阅读全文】

阅读(1781) | 评论(0) | 转发(0)

发布时间:2014-12-18 14:45:30

读了RDD的这篇论文,Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computering.伯克利写论文更注重思想,google的论文给人感觉更加注重工程上的实现。这篇论文将RDD与共享内存的方式进行了对比。表明RDD更加适合迭代计算环境,不用像mapreduce那样不断的持久化保存中间的计算结.........【阅读全文】

阅读(1178) | 评论(0) | 转发(0)

发布时间:2014-12-08 14:33:55

这种算法是一种简单的机器学习分类算法。K近邻算法需要用户定义距离度量。对于n维的特征向量而言x=(x1,x2,x3.....,xn),距离度量通常采用欧式距离。这个算法的核心思想是通过训练数据,构造出一个KD树。并对待分类的数据xp=(x1,x2,x3,....,xn) 进行XD树的搜索,直至找到一个近似K节点。步骤分为三步:1)在kd树中找出.........【阅读全文】

阅读(1005) | 评论(0) | 转发(0)

发布时间:2014-12-07 16:39:02

对于ax+b这种情形,线性回归函数,例如最小二乘法是可以解决这些问题的,但是对于多维变量函数f(x,y)而言,就无法很好的解决了。为了能够得到多维变量的回归函数,h(x)表示的是房屋的价格,根据输入的变量所产生的输出,我们采用如下方式组织各个影响因素。但是各个xn前面的参数是无法确定的,因此可以采用梯度下降的方法.........【阅读全文】

阅读(16872) | 评论(0) | 转发(0)

发布时间:2014-11-26 22:01:20

     Mesos是虚拟化的一个非常典型的应用。    Mesos是UC Berkeley的杰作,Mesos的论文在此,Mesos: A Platform for Fine-Grained Resource Sharing in the Data CenterBerkeley和Apache形成了非常经典的模式是:UC Berkeley 在github上开源,Apache负责孵化成开源项目,非常赞啊。  &nbs.........【阅读全文】

阅读(1728) | 评论(0) | 转发(0)
给主人留下些什么吧!~~

shenyanxxxy2016-01-14 13:19

少林功夫好:楼主能分析一下如何修改源码,然后从内部实现每天生成一个带日期的日志么?

修改源码非一日之功,多阅读开源项目,你说的这个功能用shell + date命令就可以。

回复  |  举报

少林功夫好2016-01-13 15:56

楼主能分析一下如何修改源码,然后从内部实现每天生成一个带日期的日志么?

回复  |  举报

shenyanxxxy2015-05-20 21:25

回复  |  举报
留言热议
请登录后留言。

登录 注册