Flume和Kafka有一部分功能是相同的服务器日志分析工具,但是整体来看,两者的差别还是很大的备案网站;它们使用的场景有所不同,但是可以相互配合使用。服务器日志分析工具,日志采集系统flume和kafka有什么区别及联系Flume简单的说,Flume是分布式日志收集系统,它把各个服务器上的日志收集起来,传送到制定的地方,比如传送到HDFS中。KafkaKafka的定位是分布式消息中间件,自带存储,提供push和pull存取数据功能。使用场景在实际应用中,系统实时产生的日志需要最后进入HDFS,但是生产上的日志数量会有波动,比如由于访问量的增加,导致突然之间产生大量的日志,这时候可能会导致日志写入HDFS失败,所以这时候可以先把日志数据写入到Kafka中,再由Kafka导入到HDFS中。总结:在日志采集系统中,把Kafka当做日志缓存更加合适,Flume做数据采集,因为它可以定制很多数据源,减少开发量,所以Flume和Kafka可以配合起来一起工作。整体的流程是这样的:服务器上的日志<–Flume–>Kafka–>HDFS–>离线计算服务器上的日志<–Flume–>Kafka–>Storm希望我的回答能够帮助到你!
本文出自快速备案,转载时请注明出处及相应链接。