在 Apache Kafka 中消息的消费和传递通过消费者与 Kafka 的分布式系统协作完成

myrgd • 2024年12月9日下午8:14 • 开源技术, 服务器

在 Apache Kafka 中，消息的消费和传递是通过消费者（Consumer）与 Kafka 的分布式系统协作完成的。以下是消息传递的主要流程：

目录表

1. Producer 生产消息到 Kafka

消息写入：Producer 将消息发送到指定的主题（Topic）。每个主题会分成多个分区（Partition）。
分区分配：消息会根据某种分区策略（如轮询或基于 key 的哈希）写入特定的分区。

2. Consumer 消费消息

Kafka 中消费者的消息消费流程如下：

2.1 订阅主题

消费者通过 Kafka 客户端订阅一个或多个主题。它可以：

直接订阅特定主题。
使用正则表达式动态订阅匹配的主题。

2.2 消费者组 (Consumer Group)

消费者组的概念：消费者可以加入一个消费者组，消费者组中的每个消费者负责消费部分分区的数据。
分区分配：
- 分区独占性：同一消费者组内的每个分区只能被一个消费者消费。
- 分配策略：Kafka 使用分区分配策略（如 Range、RoundRobin 或 StickyAssignor）将分区分配给组内消费者。

2.3 拉取消息

Pull 模式：Kafka 的消费者是以拉取模式（Pull）从 Broker 读取消息。
偏移量控制：消费者从分区中读取消息的起始点由分区的偏移量（Offset）决定。
- 默认情况下，消费者会从上次提交的偏移量开始消费。
- 可以配置从最新或最早的消息开始消费。

2.4 消息处理

消息反序列化：消费者将从 Kafka 中拉取的字节数据反序列化为应用程序可以处理的对象。
业务逻辑：消费者应用程序根据业务需求处理这些消息。

2.5 提交偏移量

自动提交：消费者定期自动将当前处理的消息偏移量提交到 Kafka。
手动提交：应用程序可以选择手动提交偏移量以实现更精确的消费控制。
- 手动提交适用于需要严格处理确保消息不丢失或重复的场景。

3. Broker 与消费者的交互

消费者与 Kafka 集群中的 Broker 通过网络通信进行消息消费：

消费者协调器（Consumer Coordinator）：每个 Broker 维护消费者组状态和分区分配信息。
组再平衡（Rebalance）：当消费者组成员发生变化（新增、减少或故障）时，Kafka 会触发重新分区分配。

4. 消费模型

Kafka 的消费模式具有以下特点：

横向扩展：消费者组可以增加消费者以实现高吞吐量处理。
可靠性：消费者通过手动提交偏移量可确保消息不丢失。
灵活性：消费者可以随时重新消费历史数据（通过指定偏移量）。

这种设计使得 Kafka 消费者具备高吞吐量、可扩展性以及灵活性，适合处理分布式环境中的大规模实时流数据。

发布者：myrgd，转载请注明出处：https://www.object-c.cn/5146

Like (0)

0 0

关于作者

myrgd

207 文章

0 评论

14 问题

1 回答

0 粉丝

这个人很懒，什么都没有留下～

微信小程序中，通过Node.js连接本地 MySQL 实现数据的增删改查

Previous 2024年12月9日下午2:43

修复 Elementor 网站上出现的 HTTPS 400 错误请求（服务器错误）

Next 2024年12月9日下午8:18

java

在进行 Java 单元测试时，遇到找不到类名的错误

在进行 Java 单元测试时，遇到找不到类名的错误，通常是由于以下几个原因引起的。下面是一些常见问题及其解决方法：1. 类路径（Classpath）问题最常见的原因是编译后的类文件没有正确地包含在类路径中，或者类文件没有被正确加载到测试框架中。要解决这个问题，确保以下几点：解决方法：确认类是否存在：首先确保测试类和目标类都已经编译，并且在正确的目录中。检查 …

myrgd
2024年11月28日
000
服务器

ubuntu服务器安装cuda11.0、cuDNN入门教程

在 Ubuntu 服务器上安装 CUDA 11.0 和 cuDNN 的详细教程如下。本教程涵盖了从环境准备到安装和验证的完整流程，适用于初学者。一、环境准备 1. 系统要求 2. 卸载旧版本（如有）清理可能存在的旧版本 CUDA 和 NVIDIA 驱动：二、安装 NVIDIA 驱动 1. 检查 GPU 支持情况使用 lspci 或 nvidia-sm…

myrgd
2024年11月22日
000
在 Ubuntu 16.04 上使用 GitLab CI 设置持续集成 (CI) 流水线步骤

在 Ubuntu 16.04 上使用 GitLab CI 设置持续集成 (CI) 流水线需要完成以下步骤。GitLab CI/CD 是一个强大的工具，可以自动化代码测试、构建和部署。步骤 1：安装 GitLab RunnerGitLab Runner 是用于执行 GitLab CI 流水线任务的工具。安装必要的软件包添加 GitLab Runner 的官…

myrgd
操作系统 2024年12月2日
001
前端开发

解决 Vue 3 应用部署到 GitHub Pages 后，遇到 404 错误问题

在将 Vue 3 应用部署到 GitHub Pages 后，遇到 404 错误通常是由于 GitHub Pages 处理路由时的问题。Vue 3 使用 Vue Router 来管理前端路由，而 GitHub Pages 本身是静态托管服务，不支持处理 SPA（单页面应用）的客户端路由。因此，当你直接访问某个页面 URL（比如 https://youruser…

myrgd
2024年11月29日
000
后端开发

远程仓库，从GitHub拉取代码失败的解决办法

从GitHub拉取代码失败通常由以下几种原因引起：网络问题、认证失败、远程仓库配置错误等。以下是常见的失败场景及解决办法。 1. 网络问题症状连接超时。报错如：fatal: unable to access ‘https://github.com/…’: Failed to connect to github.com port 443: Connecti…

myrgd
2024年11月28日
000
前端开发

部署 Harbor 时，如果运行 install 脚本报错可能导致问题的

在部署 Harbor 时，如果运行 install 脚本报错，可能是网络问题导致的。以下是排查网络问题的方法： 1. 检查网络连通性测试目标网络的连通性：检查 DNS 配置：如果解析失败，检查 /etc/resolv.conf 中的 DNS 配置，或者尝试手动指定公共 DNS，如 Google 的 8.8.8.8 或阿里云的 223.5.5.5。 2.…

myrgd
2024年12月9日
000
前端开发

在 Nuxt.js 应用中，webpack 的 compile 事件钩子构建过程

在 Nuxt.js 应用中，webpack 的 compile 事件钩子通常用于在构建过程中处理或监听 Webpack 编译的状态。webpack 是 Nuxt.js 中的核心构建工具之一，而 Nuxt.js 本身是基于 Webpack 配置的，允许你通过扩展 Webpack 配置来进行自定义。要使用 webpack 的 compile 事件钩子，首先你需要…

myrgd
2024年11月29日
000
人工智能

AI视觉领域优秀的开源项目和框架

AI视觉领域有很多优秀的开源项目和框架，可以满足不同的需求，从计算机视觉任务（如目标检测、图像分类）到复杂的视觉应用（如生成对抗网络、视频分析等）。以下是一些流行的开源框架、工具库和平台： 1. 通用计算机视觉框架 1.1 OpenCV 1.2 PyTorch Vision (TorchVision) 1.3 MMDetection 2. 图像分割与生成 2…

myrgd
2024年11月24日
000
后端开发

Redis中如何使用lua脚本redis与lua的相互调用方法

在 Redis 中，Lua 脚本提供了一种强大的方式来执行原子操作，可以在 Redis 服务器上直接执行 Lua 代码，从而避免了多次网络往返和保证操作的原子性。Redis 内置了对 Lua 脚本的支持，通过 EVAL 命令来执行脚本，EVALSHA 则用于执行已经加载到 Redis 服务器的脚本。1. Redis 与 Lua 脚本的基本交互1.1 基本的…

myrgd
2024年11月28日
000
后端开发

Docker快速部署Nginx、Redis、MySQL、Tomcat以及制作镜像方法

使用 Docker 快速部署 Nginx、Redis、MySQL、Tomcat 以及制作镜像通过 Docker，开发者可以快速部署和管理各种服务。本文介绍如何快速使用 Docker 部署 Nginx、Redis、MySQL 和 Tomcat，以及如何制作自定义镜像。 1. Docker 基础准备安装 Docker 如果还未安装 Docker，可按照以下步…

myrgd
2024年11月26日
001
java

java中使用 Arrays.asList()新增报错问题解决方法

Arrays.asList() 返回的是一个固定大小的列表。如果你尝试使用该列表进行添加、删除等修改操作，会抛出 UnsupportedOperationException 异常。这是因为 Arrays.asList() 返回的列表背后是一个数组，它的大小是固定的，不能进行动态修改。解决方法使用 ArrayList 包装 Arrays.asList() 的结…

myrgd
2024年12月2日
000
java

使用 Redis 和 Spring Cache 实现基于注解的缓存功能

Spring Cache 提供了一种简单的方法来通过注解对方法的返回结果进行缓存。结合 Redis，可以构建一个高效的分布式缓存解决方案。以下是详细实现步骤： 1. 引入必要的依赖在 pom.xml 文件中添加以下依赖（适用于 Spring Boot 项目）： 2. 配置 Redis在 application.yml 或 application.proper…

myrgd
2024年12月1日
000
后端开发

Android 解决 “Module was compiled with an incompatible version of Kotlin“

“Module was compiled with an incompatible version of Kotlin” 错误通常出现在 Android 开发中，因为模块的 Kotlin 编译器版本与项目中的 Kotlin 编译器版本不匹配。以下是解决此问题的方法： 1. 检查 Kotlin 插件版本步骤：打开 Android Studio。点击顶部菜单的 …

myrgd
2024年11月26日
000
后端开发

解决 WordPress 后台无法登录的常见问题

WordPress 后台无法登录是一个常见问题，可能由多种原因引起，包括插件冲突、主题问题、数据库错误或用户账户问题。以下是详细的排查和解决步骤： 1. 检查登录页面 URL 确保您访问的是正确的 WordPress 登录页面： 2. 清除浏览器缓存和Cookie 3. 重置密码用新密码尝试登录。 4. 禁用插件某些插件可能会导致登录问题。尝试通过以下方…

myrgd
2024年12月9日
000
后端开发

在github上提交PR(Pull Request) + 多个pr同时提交、互不干扰的方法

在 GitHub 上提交 PR（Pull Request）是一种将代码变更合并到主分支或其他目标分支的常见方式。在同时处理多个 PR 时，需要使用独立的分支来避免相互干扰。以下是详细教程：步骤一：单个 PR 的提交流程Fork 仓库如果没有直接访问权限，先 fork 原仓库到自己的 GitHub 帐号。在 fork 的仓库上操作自己的代码。克隆仓库到本地 …

myrgd
2024年11月26日
000