消息队列面试题, Kafka为什么要抛弃 Zookeeper?

QA

Step 1

Q:: Kafka为什么要抛弃Zookeeper？

A:: Kafka决定抛弃Zookeeper的主要原因是为了简化架构和提高系统的可扩展性。Kafka引入了KRaft（Kafka Raft）模式，取代了Zookeeper，用于集群元数据管理和控制器选举。KRaft通过内置的Raft共识算法，使Kafka能够直接管理集群元数据，而不依赖外部的Zookeeper。这不仅减少了运维成本，还增强了系统的稳定性和一致性。

Step 2

Q:: Kafka中的ISR（In-Sync Replicas）是什么？

A:: ISR（In-Sync Replicas）是Kafka中所有与leader副本保持同步的副本集合。ISR确保了Kafka在高可用性和数据一致性之间取得平衡。当消息被成功写入所有ISR中的副本时，Kafka认为消息是已提交的，这样即使leader副本失效，系统仍能从ISR中的其他副本中恢复数据。

Step 3

Q:: Kafka中的Consumer Group是什么？

A:: Consumer Group是Kafka中消费者的逻辑分组，一个Consumer Group中的每个消费者都会从不同的分区读取数据，从而实现负载均衡和容错机制。一个分区只能由一个Consumer Group中的一个消费者读取，这样确保了数据不会被重复处理。

Step 4

Q:: Kafka的分区（Partition）有什么作用？

A:: 分区（Partition）是Kafka中存储数据的基本单元。每个主题（Topic）可以有多个分区，数据会分布在不同的分区上，从而提高了数据的并行处理能力和吞吐量。分区还可以根据键值进行有序存储，保证同一键值的数据总是被同一个消费者读取。

消息队列面试题, Kafka为什么要抛弃 Zookeeper?