Kafka的应用场景

Kafka的应用场景

​ Kafka是一个高吞吐量的分布式发布订阅消息系统,他阔以处理消费者规模的网站中的所有动作流数据。简单的说:Kafka 就相比是一个邮箱,生产者就是发送邮件的人,消费者就是接受邮件的人,Kafka 就是用来存东西的,只不过它提供了一些处理邮件的机制。

它可以用于两大类别的应用:

  • 构造实时流数据管道,它可以在系统或应用之间可靠地获取数据。(相当于message queue)。

  • 构建实时流式应用程序,对这些流数据进行转换或者影响。(就是流处理,通过kafka stream topic和topic之间内部进行变化)

它可以用于以下的应用场景:

  • 日志收集

    一个公司阔以用 Kafka 收集各种服务的log,通过 Kafka 以统一接口服务的方式开放给各种 Consumer

  • 消息系统

    解耦生产者和消费者、缓存消息等

  • 用户活动跟踪

    Kafka 经常用来记录 web 用户或者 app 用户的各种活动,如浏览网页、搜索、点击等活动,这些活动信息被各个服务器发布到 Kafka的 topic 中,然后消费者通过订阅这些 topic 来做实时的监控分析,亦可保存到数据库

  • 运营指标

    Kafka 也经常用来记录运营监控数据。包括收集各种分布式应用的数据,生产各种操作的集中反馈,比如报警和报告

  • 流式处理

    比如 SparkStreaming 和 storm


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!