Kafka消费者组是什么？ - Go语言中文社区

社区微信群开通啦，扫一扫抢先加入社区官方微信群

社区微信群

Kafka消费者组是什么？ - Go语言中文社区

文章 (current)
Go面试题热
Go导航
Go教程
官方文档

登录
注册

Kafka消费者组是什么？

kafka

一、Kafka消费者组是什么？

Consumer Group 是Kafka提供的可扩展且具有容错性的消费者机制。在组内多个消费者实例(Consumer Instance ),它们共享一个公共的ID即 Group ID 。组内的所有消费者协调在一起消费订阅主题（Subscribed Topics）的所有分区(Partition)。当然一个分区只能有同一个消费者组的一个Consumer 实例消费。
Consumer Group 有三个特性：

Consumer Group 下可以有一个或多个Consumer 实例。这里的实例可以是一个单独的进程，也可以是同一进程下的线程；
Group ID 是一个字符串，在Kafka集群中唯一标识，Consumer Group；
Consumer Group
下所有实例订阅主体的单个分区，只能分配给组内某个Consumer实例消费。同一个分区消息可能被多个Group 消费。

二、Kafka消费者组解决了哪些问题？

传统的消息系统中，有两种消息引擎模型：点对点模型（消息队列）、发布/订阅模型
传统的两种消息系统各有优势，我们里对比一下：

传统的消息队列模型的缺陷在于消息一旦被消费，就会从队列中删除，而且只能被下游的一个Consumer消费。严格的说这不是它的缺陷，
这是它的一个特性。但很显然这种模型的伸缩性（Scalability）很差，因为下游的多个Consumer 都要“抢”
这个共享消息队列的消息；
发布/订阅模型,允许消息被多个Consumer 消费，但它的问题也是伸缩性不高，因为订阅者都必须订阅所有主体的所有分区。

Kafka 为规避传统消息两种模型的缺点，引入了 Consumer Group 机制：

当 Consumer Group 订阅多个主题后，组内的每个实例不要求一定要订阅主题的所有分区，它只会消费部分分区中的消息；
Consumer Group 之间彼此队里，互不影响，它们可以订阅同一组主题而互不干涉。加上Broker端的消息留存机制，Kafka
的Consumer Group 完美的避开了伸缩性差的问题；
kafka 是用Consumer Group
机制，实现了，传统两大消息引擎。如果所有实例属于同一个Group，那么它实现的就是消息队列模型；如果所有实例分别属于不同的Group，且订阅了相同的主题，那么它就实现了发布/订阅模型；

三、Consumer Group 实例数量多少才合理？

最理想的情况是Consumer实例的数量应该等于该Group订阅主题的分区总数。例如：Consumer Group 订阅了 3个主题，分别是A、B、C，它们的分区数依次是1、2、3，那么通常情况下，为该Group 设置6个Consumer实例是比较理想的情形。

如果设置小于或大于6的实例可以吗？当然可以，如果你有3个实例，那么平均下来每个实例大约消费2个分区（6/3=2）;如果你设置了9个实例，那么很遗憾，有3个实例（9-6=3）将不会被分配任何分区，它们永远处于空闲状态。

四、消费位移

消费者在消费的过程中要记录自己消费了多少数据，即消费位置信息，在Kafka中叫：位移（offset）。
看上去该Offset就是一个数字而已，其实对于Consumer Group 而言，它是一组KV对，Key是分区，V对应Consumer 消费该分区的最新位移。
老版本的Consumer Group把位移保存在Zookeeper中。将位移保存在Zookeeper外部系统显然好处是减少了Kafka Broker 端的状态保存开销。现在比较流行的提法是将服务器节点做成无状态的，这样可以自由扩缩容，实现超强的伸缩性。不过在实际使用场景中，发现ZooKeeper 这类元框架并不是适合进行频繁的写更新，而Consumer Group 的位移更新却是一个非常频繁的操作。这种大吞吐量的写操作极大的拖慢了ZooKeeper 集群的性能，在新版本的Consumer Group 中，Kafka 社区采用了将Consumer Group 位移保存在Broker 端的内部主题中。

五、Rebalance

Rebalance 本质上是一种协议，规定了一个Consumer Group 下所有Consumer 如何达成一致，来分配订阅Topic的每个分区。比如：某个Group 下有20个Consumer 实例，它订阅了一个具有100个分区的Topic。正常情况下，Kafka 平均会为每个Consumer 分配5个分区。这个分配的过程叫Rebalance。
Consumer Group触发 Rebalance有三种情况：

组成员数量发生变化，比如有新的Consumer 实例加入组或离开组，抑或是有Consumer实例崩溃被“踢出”组。
订阅主题数量发生变更。 Consumer Group 可以使用正则表达式订阅主题，比如
consumer.subscribe(Pattern.complile(“t.*c”))就表明该Group订阅所有t开头，字母c结尾的主题。在Consumer
Group 运行时，新创建一个满足这样条件的主题，那么会触发订阅该主题所有Group 开始Rebalance。
订阅主题分区数发生变化，Kakfka 一个主题，当分区数增加时，就会触发订阅该主题的所有Group开启Rebalance。

Consumer Group 发生Rebalance 的过程：某个 Consumer Group 下有两个Consumer ，比如A和B，当第三个成员C加入时，Kafka会触发Rebalance，并根据默认的分配策重新分配A、B、C分配分区，如下图：

注意：目前Rebalance 的设计是所有Consumer实例共同参与，全部重新分配所有分区，Rebalance过程所有Consumer 实例都会停止消费，等待Rebalance 完成。Rebalance 很慢，一个Group 内有几百个Consumer实例，成功进行一次Rebalance需要好几个小时。目前社区没有终极解决方案，最好的解决方案是规避Rebalane的发生。

版权声明：本文来源CSDN，感谢博主原创文章，遵循 CC 4.0 by-sa 版权协议，转载请附上原文出处链接和本声明。
原文链接：https://blog.csdn.net/qq_36918149/article/details/99656156
站方申明：本站部分内容来自社区用户分享，若涉及侵权，请联系站方删除。

发表于 2020-03-01 19:46:57

阅读 ( 1534 )

分类：

你可能感兴趣的文章

goka——基于kafka的go语言流处理框架 2045 浏览
[Kafka]为什么使用kafka? 1644 浏览
golang基础-WaitGroup、kafka消费者 1383 浏览
kafka2.0-使用protobuf实现序列化_08 2069 浏览
Kafka实现高并发的原理（消息中间件如何实现每秒几十万的高并发写入） 2311 浏览
一次 kafka 消息堆积问题排查 1424 浏览
图解 Kafka 水印备份机制 1450 浏览
记一次 Kafka 集群线上扩容 1480 浏览
关于 Kafka 的一些面试题目 1699 浏览

精选的优质文章

也许 Go 开发可以更简单！ 10564 浏览
如何使用 Golang 日志监控你的应用程序？ 12039 浏览
从Go语言实现模板设计模式浅谈Go的抽象能力 14095 浏览
阿里云基于 Go 的微服务架构分享 23954 浏览
java是否会被取代？Go会否给Java带来冲击？ 28483 浏览
千万级规模高性能、高并发的网络架构经验分享 30037 浏览
阿里部分面试题汇总,对想进阿里的同学非常实用 62330 浏览
实用好文：知乎实时数仓架构实践及演进 31353 浏览
支撑马蜂窝「双11」营销大战背后的技术架构 228301 浏览
想进大厂？50个多线程面试题，你会多少？（一） 23084 浏览

0 条评论

请先登录后评论

官方社群

关注公众号
—— 加入社区微信群 ——
→「Go语言教程」领取

GO教程

1.1 Go语言简介
1.2 Go语言的特性
1.3 Go语言为并发而生
1.4 哪些项目使用Go语言开发？
1.5 哪些大公司正在使用Go语言
1.6 Go语言的性能如何？
1.7 Go语言标准库强大
1.8 Go语言上手简单
1.9 Go语言代码风格清晰、简单
1.10 Go语言工程结构详述
1.11 第一个Go语言程序
1.12 Go语言历史版本

2.1 Go语言变量的声明
2.2 Go语言变量的初始化
2.3 Go语言多个变量同时赋值
2.4 Go语言匿名变量
2.5 Go语言变量的作用域
2.6 Go语言整型（整数类型）
2.7 Go语言浮点类型（小数类型）
2.8 Go语言复数
2.9 Go语言bool类型（布尔类型）
2.10 Go语言字符串
2.11 Go语言字符类型（byte和rune）
2.12 Go语言数据类型转换
2.13 Go语言指针
2.14 Go语言变量的生命周期
2.15 Go语言常量
2.16 Go语言类型别名
2.17 Go语言关键字与标识符
2.18 Go语言运算符的优先级

3.1 Go语言数组
3.2 Go语言多维数组
3.3 Go语言切片
3.4 使用append()为切片添加元素
3.5 Go语言切片复制
3.6 Go语言从切片中删除元素
3.7 Go语言range关键字
3.8 Go语言多维切片
3.9 Go语言map（映射）
3.10 Go语言遍历map
3.11 map元素的删除和清空
3.12 Go语言sync.Map
3.13 Go语言list（列表）
3.14 Go语言nil：空值/零值

4.1 Go语言分支结构
4.2 Go语言循环结构
4.4 Go语言键值循环
4.5 Go语言switch语句
4.6 Go语言goto语句
4.7 Go语言break（跳出循环）
4.8 Go语言continue

5.1 Go语言函数声明
5.2 Go语言函数变量
5.3 Go语言匿名函数
5.4 Go语言函数类型实现接口
5.5 Go语言闭包（Closure）
5.6 Go语言可变参数
5.7 Go语言defer（延迟执行语句）
5.8 Go语言递归函数
5.9 Go语言处理运行时错误
5.10 Go语言宕机（panic）
5.11 Go语言宕机恢复（recover）
5.12 Go语言计算函数执行时间
5.13 Go语言Test功能测试函数

6.1 Go语言结构体定义
6.2 Go语言实例化结构体
6.3 初始化结构体的成员变量
6.4 Go语言构造函数
6.5 类型内嵌和结构体内嵌
6.6 初始化内嵌结构体
6.7 内嵌结构体成员名字冲突
6.8 Go语言垃圾回收和SetFinalizer
6.9 Go语言链表操作
6.10 Go语言数据I/O对象及操作

7.1 Go语言接口声明（定义）
7.2 Go语言实现接口的条件
7.3 Go语言类型与接口的关系
7.4 Go语言类型断言
7.5 Go语言排序
7.6 Go语言接口的嵌套组合
7.9 Go语言接口和类型之间的转换
7.10 Go语言空接口类型
7.11 Go语言类型分支
7.12 Go语言error接口

8.1 包的基本概念
8.2 Go语言封装简介及实现细节
8.3 Go语言GOPATH
8.4 Go语言常用内置包
8.5 Go语言自定义包
8.6 Go语言package
8.7 Go语言导出包中的标识符
8.8 Go语言import导入包
8.9 Go语言sync包与锁
8.10 Go语言big包
8.11 Go语言正则表达式：regexp包
8.12 Go语言time包：时间和日期
8.13 Go语言os包用法简述
8.14 Go语言flag包：命令行参数解析
8.15 Go语言go mod包依赖管理工具
8.16 Go语言runtime包:运行时

9.1 Go语言并发简述
9.2 Go语言轻量级线程
9.3 Go语言并发通信
9.4 Go语言竞争状态
9.5 Go语言调整并发的运行性能
9.6 并发和并行的区别
9.7 goroutine和coroutine的区别
9.8 Go语言通道（chan）
9.9 示例：并发打印
9.10 Go语言单向通道
9.11 Go语言无缓冲的通道
9.12 Go语言带缓冲的通道
9.13 Go语言channel超时机制
9.14 Go语言多核并行化
9.15 互斥锁和读写互斥锁
9.16 Go语言等待组
9.17 死锁、活锁和饥饿概述
9.18 Go语言CSP：通信顺序进程简述
9.19 示例：聊天服务器

10.1 Go语言反射（reflection）
10.2 Go语言反射规则浅析
10.3 通过反射获取类型信息
10.4 通过反射获取指针指向的元素类型
10.5 通过反射获取结构体的成员类型
10.6 Go语言结构体标签
10.7 通过反射获取值信息
10.8 通过反射访问结构体成员的值
10.9 判断反射值的空和有效性
10.10 通过反射修改变量的值
10.11 通过类型信息创建实例
10.12 通过反射调用函数
10.13 Go语言inject库：依赖注入

11.1 Go语言自定义数据文件
11.2 Go语言JSON文件的读写操作
11.3 Go语言XML文件的读写操作
11.4 Go语言使用Gob传输数据
11.5 Go语言纯文本文件的读写操作
11.6 Go语言二进制文件的读写操作
11.7 Go语言自定义二进制文件的读写操作
11.8 Go语言zip归档文件的读写操作
11.9 Go语言tar归档文件的读写操作
11.10 Go语言使用buffer读取文件
11.11 Go语言文件的写入、追加、读取、复制操作
11.12 Go语言文件锁操作

12.1 go build命令
12.2 go clean命令
12.3 go run命令
12.4 go fmt命令
12.5 go install命令
12.6 go get命令
12.7 go generate命令
12.8 go test命令
12.9 go pprof命令

13.1 Go语言的深拷贝和浅拷贝
13.2 Go语言引用传递和值传递
13.3 Go语言的Socket编程

14.1 Golang Map底层实现
14.2 go语言触发异常的场景有哪些
14.3 Printf()、Sprintf()、Fprintf()函数的区别用法是什么
14.4 详细说说new和make的区别
14.5 详细说说切片和数组的区别
14.6 Golang的内存模型，为什么小对象多了会造成gc压力
14.7 Data Race问题怎么解决？能不能不加锁解决这个问题
14.8 在 range 迭代 slice 时，你怎么修改值的
14.9 select可以用于什么
14.10 go语言编程的好处是什么
14.11 你是否主动关闭过http连接，为啥要这样做
14.12 recover的执行时机
14.13 说出一个避免Goroutine泄露的措施
14.14 如何跳出for select 循环
14.15 如何初始化带嵌套结构的结构体
14.16 Printf()、Sprintf()、Fprintf()函数的区别用法是什么
14.17 go语言中的引用类型包含哪些
14.18 说说go语言的select机制

推荐文章

大数据架构:Kafka
kafka_2.12-1.1.0 生产与消费java实现示例
Kafka从零开始之简介
kafka的核心概念原理
Kafka监控-JMX自定义监控以及常用监控工具比较
Kafka监控框架介绍
【kafka】简单粗暴从0开始在linux上安装kafka并简单使用
如何使用JMX监控Kafka
Kafka(一)：基础
kafka中文教程

猜你喜欢

随便看看

html怎么样写表单，表单详细教程
java多线程-生产者和消费者问题
【Big Data 每日一题20181001】java 深拷贝方案（中英版）
Google开源的自动化工具LightHouse的使用
JavaScript的new操作做了什么？
JavaScript--new创建对象的过程
javascript中的new
算法系列15天速成——第八天线性表【下】
mySQL group by 默认取分组结果的第一条记录
如何区分前后端BUG？

Go语言中文社区 | 联系我们 | 官方标准库 | 京ICP备18055895号-2

欢迎关注Go语言社区官方微信公众号，商务合作联系QQ：124096702

Powered By Release 20180601 ©2009-2022 coder55.com

发送私信

发给:

内容:

如果觉得我的文章对您有用，请随意打赏。你的支持将鼓励我继续创作！