开源日志系统比较-gron-ChinaUnix博客

黑小子博客gron.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

gron

博客访问： 2195059
博文数量： 317
博客积分： 5670
博客等级：大校
技术积分： 3677
用户组：普通用户
注册时间： 2008-08-10 17:51

文章分类

全部博文（317）

mcat（2）
日志系统（2）

awstats（1）
工具（1）
代理服务（0）
SVN（11）
FTP（1）
python（2）
tomcat（0）
存储（6）
SEO技术（0）
proxy（0）
Cache（5）

redis（1）
DNS（2）
自动化管理（3）
redis（4）
素质培养（2）
压力测试（3）
监控报警（12）

zabbix（1）
报错问题（19）

系统（2）
性能测试与优化（27）
DB（42）

MongoDB（1）

MySql（40）
Web（48）

php（4）

IIS（1）

nginx（15）

apache（16）
技术常识（5）
shell（10）
Iptables（5）
集群HA（8）
Nagios（6）
Safety +&nb（12）
System（29）
Command（37）
Mail（5）

iredmail（0）

Postfix（2）

Qmail（3）
Cacti（3）
安装配置（5）
未分配的博文（0）

文章存档

2016年（2）

2015年（44）

2014年（68）

2013年（42）

2012年（23）

2011年（51）

2010年（67）

2009年（17）

2008年（3）

我的朋友

相关博文

开源日志系统比较

分类： LINUX

2015-06-23 10:34:14

Category: View: 195,913 Author: Dong

作者: | 新浪微博： | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及
网址:
本博客的文章集合:

本博客微信公共账号：hadoop123（微信号为：hadoop-123），分享hadoop技术内幕，hadoop最新技术进展，发布hadoop相关职位和求职信息，hadoop技术交流聚会、讲座以及会议等。二维码如下：

1. 背景介绍

许多公司的平台每天会产生大量的日志（一般为流式数据，如，搜索引擎的pv，查询等），处理这些日志需要特定的日志系统，一般而言，这些系统需要具有以下特征：

（1）构建应用系统和分析系统的桥梁，并将它们之间的关联解耦；

（2）支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统；

（3）具有高可扩展性。即：当数据量增加时，可以通过增加节点进行水平扩展。

本文从设计架构，负载均衡，可扩展性和容错性等方面对比了当今开源的日志系统，包括facebook的scribe，apache的chukwa，linkedin的kafka和cloudera的flume等。

2. FaceBook的Scribe

Scribe是facebook开源的日志收集系统，在facebook内部已经得到大量的应用。它能够从各种日志源上收集日志，存储到一个中央存储系统（可以是NFS，分布式文件系统等）上，以便于进行集中统计分析处理。它为日志的“分布式收集，统一处理”提供了一个可扩展的，高容错的方案。

它最重要的特点是容错性好。当后端的存储系统crash时，scribe会将数据写到本地磁盘上，当存储系统恢复正常后，scribe将日志重新加载到存储系统中。

架构：

scribe的架构比较简单，主要包括三部分，分别为scribe agent， scribe和存储系统。

(1) scribe agent

scribe agent实际上是一个thrift client。向scribe发送数据的唯一方法是使用thrift client， scribe内部定义了一个thrift接口，用户使用该接口将数据发送给server。

(2) scribe

scribe接收到thrift client发送过来的数据，根据配置文件，将不同topic的数据发送给不同的对象。scribe提供了各种各样的store，如 file， HDFS等，scribe可将数据加载到这些store中。

(3) 存储系统

存储系统实际上就是scribe中的store，当前scribe支持非常多的store，包括file（文件），buffer（双层存储，一个主储存，一个副存储），network（另一个scribe服务器），bucket（包含多个 store，通过hash的将数据存到不同store中），null(忽略数据)，thriftfile（写到一个Thrift TFileTransport文件中）和multi（把数据同时存放到不同store中）。

3. Apache的Chukwa

chukwa是一个非常新的开源项目，由于其属于hadoop系列产品，因而使用了很多hadoop的组件（用HDFS存储，用mapreduce处理数据），它提供了很多模块以支持hadoop集群日志分析。

需求：

(1) 灵活的，动态可控的数据源

(2) 高性能，高可扩展的存储系统

(3) 合适的框架，用于对收集到的大规模数据进行分析

架构：

Chukwa中主要有3种角色，分别为：adaptor，agent，collector。

(1) Adaptor 数据源

可封装其他数据源，如file，unix命令行工具等

目前可用的数据源有：hadoop logs，应用程序度量数据，系统参数数据（如linux cpu使用流率）。

(2) HDFS 存储系统

Chukwa采用了HDFS作为存储系统。HDFS的设计初衷是支持大文件存储和小并发高速写的应用场景，而日志系统的特点恰好相反，它需支持高并发低速率的写和大量小文件的存储。需要注意的是，直接写到HDFS上的小文件是不可见的，直到关闭文件，另外，HDFS不支持文件重新打开。

(3) Collector和Agent

为了克服(2)中的问题，增加了agent和collector阶段。

Agent的作用：给adaptor提供各种服务，包括：启动和关闭adaptor，将数据通过HTTP传递给Collector；定期记录adaptor状态，以便crash后恢复。

Collector的作用：对多个数据源发过来的数据进行合并，然后加载到HDFS中；隐藏HDFS实现的细节，如，HDFS版本更换后，只需修改collector即可。

(4) Demux和achieving

直接支持利用MapReduce处理数据。它内置了两个mapreduce作业，分别用于获取data和将data转化为结构化的log。存储到data store（可以是数据库或者HDFS等）中。

4. LinkedIn的Kafka

Kafka是2010年12月份开源的项目，采用scala语言编写，使用了多种效率优化机制，整体架构比较新颖（push/pull），更适合异构集群。

设计目标：

(1) 数据在磁盘上的存取代价为O(1)

(2) 高吞吐率，在普通的服务器上每秒也能处理几十万条消息

(3) 分布式架构，能够对消息分区

(4) 支持将数据并行的加载到hadoop

架构：

Kafka实际上是一个消息发布订阅系统。producer向某个topic发布消息，而consumer订阅某个topic的消息，进而一旦有新的关于某个topic的消息，broker会传递给订阅它的所有consumer。在kafka中，消息是按topic组织的，而每个topic又会分为多个partition，这样便于管理数据和进行负载均衡。同时，它也使用了zookeeper进行负载均衡。

Kafka中主要有三种角色，分别为producer，broker和consumer。

(1) Producer

Producer的任务是向broker发送数据。Kafka提供了两种producer接口，一种是low_level接口，使用该接口会向特定的broker的某个topic下的某个partition发送数据；另一种那个是high level接口，该接口支持同步/异步发送数据，基于zookeeper的broker自动识别和负载均衡（基于Partitioner）。

其中，基于zookeeper的broker自动识别值得一说。producer可以通过zookeeper获取可用的broker列表，也可以在zookeeper中注册listener，该listener在以下情况下会被唤醒：

a．添加一个broker

b．删除一个broker

c．注册新的topic

d．broker注册已存在的topic

当producer得知以上时间时，可根据需要采取一定的行动。

(2) Broker

Broker采取了多种策略提高数据处理效率，包括sendfile和zero copy等技术。

(3) Consumer

consumer的作用是将日志信息加载到中央存储系统上。kafka提供了两种consumer接口，一种是low level的，它维护到某一个broker的连接，并且这个连接是无状态的，即，每次从broker上pull数据时，都要告诉broker数据的偏移量。另一种是high-level 接口，它隐藏了broker的细节，允许consumer从broker上push数据而不必关心网络拓扑结构。更重要的是，对于大部分日志系统而言，consumer已经获取的数据信息都由broker保存，而在kafka中，由consumer自己维护所取数据信息。

5. Cloudera的Flume

Flume是cloudera于2009年7月开源的日志系统。它内置的各种组件非常齐全，用户几乎不必进行任何额外开发即可使用。

设计目标：

(1) 可靠性

当节点出现故障时，日志能够被传送到其他节点上而不会丢失。Flume提供了三种级别的可靠性保障，从强到弱依次分别为：end-to-end（收到数据agent首先将event写到磁盘上，当数据传送成功后，再删除；如果数据发送失败，可以重新发送。），Store on failure（这也是scribe采用的策略，当数据接收方crash时，将数据写到本地，待恢复后，继续发送），Best effort（数据发送到接收方后，不会进行确认）。

(2) 可扩展性

Flume采用了三层架构，分别问agent，collector和storage，每一层均可以水平扩展。其中，所有agent和collector由master统一管理，这使得系统容易监控和维护，且master允许有多个（使用ZooKeeper进行管理和负载均衡），这就避免了单点故障问题。

(3) 可管理性

所有agent和colletor由master统一管理，这使得系统便于维护。用户可以在master上查看各个数据源或者数据流执行情况，且可以对各个数据源配置和动态加载。Flume提供了web 和shell script command两种形式对数据流进行管理。

(4) 功能可扩展性

用户可以根据需要添加自己的agent，colletor或者storage。此外，Flume自带了很多组件，包括各种agent（file， syslog等），collector和storage（file，HDFS等）。

架构：

正如前面提到的，Flume采用了分层架构，由三层组成，分别为agent，collector和storage。其中，agent和collector均由两部分组成：source和sink，source是数据来源，sink是数据去向。

(1) agent

agent的作用是将数据源的数据发送给collector，Flume自带了很多直接可用的数据源（source），如：

text(“filename”)：将文件filename作为数据源，按行发送

tail(“filename”)：探测filename新产生的数据，按行发送出去

fsyslogTcp(5140)：监听TCP的5140端口，并且接收到的数据发送出去

同时提供了很多sink，如：

console[("format")] ：直接将将数据显示在桌面上

text(“txtfile”)：将数据写到文件txtfile中

dfs(“dfsfile”)：将数据写到HDFS上的dfsfile文件中

syslogTcp(“host”,port)：将数据通过TCP传递给host节点

(2) collector

collector的作用是将多个agent的数据汇总后，加载到storage中。它的source和sink与agent类似。

下面例子中，agent监听TCP的5140端口接收到的数据，并发送给collector，由collector将数据加载到HDFS上。

host : syslogTcp(5140) | agentSink("localhost",35853) ;
collector : collectorSource(35853) | collectorSink(" ","syslog");

一个更复杂的例子如下：

有6个agent，3个collector，所有collector均将数据导入HDFS中。agent A，B将数据发送给collector A，agent C，D将数据发送给collectorB，agent C，D将数据发送给collectorB。同时，为每个agent添加end-to-end可靠性保障（Flume的三种可靠性保障分别由agentE2EChain, agentDFOChain, and agentBEChain实现），如，当collector A出现故障时，agent A和agent B会将数据分别发给collector B和collector C。

下面是简写的配置文件片段：

agentA : src | agentE2EChain("collectorA:35853","collectorB:35853");
agentB : src | agentE2EChain("collectorA:35853","collectorC:35853");
agentC : src | agentE2EChain("collectorB:35853","collectorA:35853");
agentD : src | agentE2EChain("collectorB:35853","collectorC:35853");
agentE : src | agentE2EChain("collectorC:35853","collectorA:35853");
agentF : src | agentE2EChain("collectorC:35853","collectorB:35853");
collectorA : collectorSource(35853) | collectorSink("","src");
collectorB : collectorSource(35853) | collectorSink("","src");
collectorC : collectorSource(35853) | collectorSink("","src");

此外，使用autoE2EChain，当某个collector 出现故障时，Flume会自动探测一个可用collector，并将数据定向到这个新的可用collector上。

(3) storage

storage是存储系统，可以是一个普通file，也可以是HDFS，HIVE，HBase等。

6. 总结

根据这四个系统的架构设计，可以总结出典型的日志系统需具备三个基本组件，分别为agent（封装数据源，将数据源中的数据发送给collector），collector（接收多个agent的数据，并进行汇总后导入后端的store中），store（中央存储系统，应该具有可扩展性和可靠性，应该支持当前非常流行的HDFS）。

下面表格对比了这四个系统：

7. 参考资料

scribe主页：

chukwa主页：http://incubator.apache.org/chukwa/

kafka主页：h

Flume主页：http

原创文章，转载请注明： 转载自

本文链接地址:

作者：，作者介绍：

本博客的文章集合:

分享到：QQ空间新浪微博腾讯微博人人网开心网更多 79

, , , ,

评论 (9)

引用通告 (17)

1楼

Post: 2011-08-09 08:48

手机网络问题,尚未获取到贵博客RSS地址

留言表示长期关注学术天才董哥

[]
2楼郭小刀

Post: 2011-08-10 09:54

高手，请问一下淘宝目前是在哪一套基础上改写的？？如果是一般的小公司要从无到有地建设日志系统的话建议哪一种？大概需要哪些成本？？

[]

图海回复:
八月 14th, 2011 at 下午 4:00

淘宝使用的是自主开发的一套日志采集系统，名字叫做TimeTunnel，已经开源，感兴趣的话可以从找到相关资料和代码。

[]
3楼郭小刀

Post: 2011-08-10 09:55

请问一下淘宝目前是在哪一套基础上改写的？？如果是一般的小公司要从无到有地建设日志系统的话建议哪一种？大概需要哪些成本？？

[]

回复:
十二月 25th, 2012 at 下午 12:41

据我了解，是在Kafka的设计上，改进而来的。

[]
4楼hxc

Post: 2013-01-24 15:50

还有个日志系统，syslog-ng也很强大

[]

king 回复:
十月 14th, 2013 at 上午 5:47

syslog-ng性能很成问题的，线上流量高峰一个CDN节点每分钟产生数GB的日志，syslog-ng处理不过来。。

[]
5楼fresh

Post: 2013-12-12 02:32

请问董哥哥，有没有对以上的产品有一个性能上的对比？哪个传输的性能高点呢？

[]

Dong 回复:
十二月 13th, 2013 at 上午 1:48

目前没有对比，因为性能只是一方面，还要考虑稳定性，可靠性等，有时候，稳定性好，性能甚至可以差一点。大家选型的时候，会统筹考虑。

[]
6楼

Post: 2013-12-13 02:44

请问下，您现在线上一般用啥来收集日志

[]
7楼echo

Post: 2013-12-17 04:21

请问蕫大神可不可以为什么看到网上说使用 kafka + flume + storm来做实时日志分析呢？直接 flume + storm不可以么？另外 flume + spark 是不是也可以做实时分析？

[]

Dong 回复:
十二月 17th, 2013 at 上午 5:38

做你自己的，管别人干嘛，每个人需求不同。

[]
8楼jssfy

Post: 2014-02-11 03:59

请问您开头提到的“流式数据”是怎么定义的

[]

hailan 回复:
三月 12th, 2014 at 上午 9:15

简单理解就是源源不断产生的数据

[]
9楼javhu

Post: 2014-06-20 14:08

flume的框架是不是push/Polling?

[]

阅读(1142) | 评论(0) | 转发(0) |

上一篇：ssh执行远程服务器需要sudo提权的脚本

下一篇：newusers和chpasswd的用法 - 大批量添加用户

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6

最多留言日志

评论 (9) 引用通告 (17)

1楼

Post: 2011-08-09 08:48

2楼郭小刀

Post: 2011-08-10 09:54

3楼郭小刀

Post: 2011-08-10 09:55

4楼hxc

Post: 2013-01-24 15:50

5楼fresh

Post: 2013-12-12 02:32

6楼

Post: 2013-12-13 02:44

7楼echo

Post: 2013-12-17 04:21

8楼jssfy

Post: 2014-02-11 03:59

9楼javhu

Post: 2014-06-20 14:08

评论 (9)

引用通告 (17)