生产过程分析 · JAVA

[TOC] # 写入方式 producer采用推(push)模式将消息发布到broker中,每条消息都被追加(append)到分区(patition)中,属于顺序写磁盘(顺序写磁盘效率要比随机写内存要高,保障kafka吞吐率) # 分区(partition) kafka集群有多个消息代理服务器(broker-server)组成,发布到kafka集群的每条消息都有一个类别,用主题(topic)来表示.通常,不同应用产生不同类型的数据,可以设置不同的主题.一个主题一般会有多个消息的订阅者,当生产者发布消息到某个主题时,订阅了这个主题的消费者都可以接收到生产者写入的新消息. kafka集群为每个主题维护了分布式的分区(partition)日志文件,物理意义上可以把主题(topic)看作进行了分区的日志文件(partition log).主题的每个分区都是一个有序的,不可变的记录序列,新的消息会不断追加到日志中.分区的每条消息都会按照时间顺序分配到一个单调递增的顺序编号,叫做偏移量(offset),这个偏移量能够唯一地定位当前分区内的每一条消息消息发送时都被发送到一个topic,其本质就是一个目录,而topic是由一些partition logs(分区日志)组成 ![](https://box.kancloud.cn/77895365c53573659c93f4d1fb2d5f0b_484x273.png) 每个partition中的消息都是**有序**的,生产的消息被不断追加到partition log上,其中每个消息都被赋予了一个唯一的**offset值** 发布到kafka主题的每条消息包括键值和时间戳.消息到达服务器端的指定分区后,都会分配到一个自增的偏移量.**原始的消息内容和分配的偏移量以及其他一些元数据信息最后都会存储到分区日志文件中.**消息的键也可以不用设置,这种情况下消息会均衡地分布到不同的分区. 存储消息可以指定 `key partition value` 如果指定了partition,那么key就没有意义了,即使设置了也没有用. 如果没有partition,那么指定key,他会对key进行hash来决定分到哪里 ## 分区的原因 1. 方便在集群中扩展,每个partition可以通过调整以适应它所在的机器,而一个topic又可以有多个partition组成,因此整个集群就可以适应任意大小的数据了. 2. 可以提高并发,因为可以以partition为单位读写了传统消息系统在服务端保持消息的顺序,如果有多个消费者消费同一个消息队列,服务端会以消费存储的顺序依次发送给消费者.但由于消息是异步发送给消费者的,消息到达消费者的顺序可能是无序的,这就意味着在并行消费时,传统消息系统无法很好的保证消息被顺序处理.虽然我们可以设置一个专用的消费者只消费一个队列,以此来解决消息顺序的问题,但是这就使得消费处理无法真正执行. kafka比传统消息系统有更强的顺序性保证,它使用主题的分区为消息处理的并行单元.kafka以分区作为最小的粒度,将每个分区分配给消费者组中不同的而且是唯一的消费者,并确保一个分区只属于一个消费者,即这个消费者就是这个分区的唯一读取线程.那么,只要分区的消息是有序的,消费者处理的消息顺序性就能保证.每个主题有多个分区,不同的消费者处理不同的分区,所以kafka不仅保证了消息的有序性,也做到了消费者的负载均衡 ## 分区的原则 1. 指定了partition,则直接使用 2. 未指定partition但指定key,通过对key的value进行hash出一个partition 3. partition和key都未指定,使用轮询选出一个partition ~~~ DefaultPartitioner类 public int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster) { List<PartitionInfo> partitions = cluster.partitionsForTopic(topic); int numPartitions = partitions.size(); if (keyBytes == null) { int nextValue = nextValue(topic); List<PartitionInfo> availablePartitions = cluster.availablePartitionsForTopic(topic); if (availablePartitions.size() > 0) { int part = Utils.toPositive(nextValue) % availablePartitions.size(); return availablePartitions.get(part).partition(); } else { // no partitions are available, give a non-available partition return Utils.toPositive(nextValue) % numPartitions; } } else { // hash the keyBytes to choose a partition return Utils.toPositive(Utils.murmur2(keyBytes)) % numPartitions; } } ~~~ # 副本(Replication) 同一个partition可能会有多个replication(对应server.properties配置中的default.replication.factor=N).没有replication的情况下,一旦broker宕机,其上所有partition的数据都不可被消费,同时producer也不能再将数据存于其上的partition.引入replication之后,同一个partition可能会有多个replication,而这时需要在这些replication之间选出一个leader,producer和consumer只与这个leader交互,其它replication作为follower从leader中复制数据 # Producer写入流程 ![](https://box.kancloud.cn/8587ab73eabe4456cc6c5ef6331ce4a7_1758x756.png) 1. producer先从zookeeper的`"/brokers/../state"`节点找到该partition的leader 2. producer将消息发送给该leader 3. leader将消息写入本地log 4. followers从leader pull消息,写入本地log后向leader发送ACK 5. leader收到所有ISR中的replication的ACK后,增加HW(high watermark,最后commit的offset)并向producer发送ACK