Tachyon：伯克利的分布式文件系统-gpingyang-ChinaUnix博客

gpingyang的ChinaUnix博客

首页　| 　博文目录　| 　关于我

gpingyang

博客访问： 69127
博文数量： 13
博客积分： 0
博客等级：民兵
技术积分： 174
用户组：普通用户
注册时间： 2013-08-19 18:05

文章分类

全部博文（13）

数据库（5）
GIS（0）
大数据（1）
不分类（3）
linux（3）
mysql（1）
未分配的博文（0）

文章存档

2015年（1）

2014年（9）

2013年（3）

我的朋友

相关博文

Tachyon：伯克利的分布式文件系统

分类：大数据

2014-03-22 12:31:24

Tachyon是一个高容错的分布式文件系统，允许文件以内存的速度在集群框架中进行可靠的共享，类似Spark和 MapReduce。通过利用lineage信息，积极地使用内存，Tachyon的吞吐量要比HDFS高300多倍。Tachyon都是在内存中处理缓存文件，并且让不同的 Jobs/Queries以及框架都能内存的速度来访问缓存文件。

它现在还处于开发状态，刚刚发布Alpha版本。当前它采用HDFS作为存储底层，在单个结点上支持本地文件系统。

Tachyon速度快得益于lineage-based recovery。以往实现容错往往需要copy多份副本，Tachyon没有这么做，它是靠保存程序来实现容错机制的。比如一个程序P,输入为A，输出为B，Tachyon保存的是程序P而不是B的多个副本，当B丢失找不到时，通过输入A重新生成B。

当然，实现lineage-based，这里需要三个前提：
1）数据是不变的
2）对于相同的输入，只有一个确定的输出
3）程序的大小远小于数据的大小

以上个人大体上的理解，更详细的信息见：

[tachyon主页]()

[Tachyon: Memory Throughput I/O for Cluster Computing Frameworks](~haoyuan/papers/2013_ladis_tachyon.pdf)

阅读(2790) | 评论(0) | 转发(0) |

上一篇：构建mysql调试环境

下一篇：linux 下hook函数

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6