Kafka的应用场景
Kafka的应用场景
Kafka是一个高吞吐量的分布式发布订阅消息系统,他阔以处理消费者规模的网站中的所有动作流数据。简单的说:Kafka 就相比是一个邮箱,生产者就是发送邮件的人,消费者就是接受邮件的人,Kafka 就是用来存东西的,只不过它提供了一些处理邮件的机制。
它可以用于两大类别的应用:
构造实时流数据管道,它可以在系统或应用之间可靠地获取数据。(相当于message queue)。
构建实时流式应用程序,对这些流数据进行转换或者影响。(就是流处理,通过kafka stream topic和topic之间内部进行变化)
它可以用于以下的应用场景:
日志收集
一个公司阔以用 Kafka 收集各种服务的log,通过 Kafka 以统一接口服务的方式开放给各种 Consumer
消息系统
解耦生产者和消费者、缓存消息等
用户活动跟踪
Kafka 经常用来记录 web 用户或者 app 用户的各种活动,如浏览网页、搜索、点击等活动,这些活动信息被各个服务器发布到 Kafka的 topic 中,然后消费者通过订阅这些 topic 来做实时的监控分析,亦可保存到数据库
运营指标
Kafka 也经常用来记录运营监控数据。包括收集各种分布式应用的数据,生产各种操作的集中反馈,比如报警和报告
流式处理
比如 SparkStreaming 和 storm
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!