SpringBoot整合kafka

迈不过友情╰ 2022-01-29 15:19 432阅读 0赞

1、搭建项目,在https://start.spring.io/网站中,添加kafka依赖,生成项目

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dqbHp4_size_16_color_FFFFFF_t_70

2、在application.properties文件中添加kafka配置

  1. #生产者
  2. #kafka服务器地址
  3. spring.kafka.producer.bootstrap-servers=xx.xx.xx.xx:9092,xx.xx.xx.xx:9091
  4. #重发次数
  5. spring.kafka.producer.retries=1
  6. #批量提交大小
  7. spring.kafka.producer.batch-size=16384
  8. #缓存大小
  9. spring.kafka.producer.buffer-memory=33554432
  10. #最大请求消息体大小
  11. spring.kafka.producer.properties.max.requst.size=2097152
  12. #key序列化类
  13. spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer
  14. #value序列化类
  15. spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer
  16. #procedure要求leader在考虑完成请求之前收到的确认数,用于控制发送记录在服务端的持久化,其值可以为如下:
  17. #acks = 0 如果设置为零,则生产者将不会等待来自服务器的任何确认,该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下,无法保证服务器已收到记录,并且重试配置将不会生效(因为客户端通常不会知道任何故障),为每条记录返回的偏移量始终设置为-1。
  18. #acks = 1 这意味着leader会将记录写入其本地日志,但无需等待所有副本服务器的完全确认即可做出回应,在这种情况下,如果leader在确认记录后立即失败,但在将数据复制到所有的副本服务器之前,则记录将会丢失。
  19. #acks = all 这意味着leader将等待完整的同步副本集以确认记录,这保证了只要至少一个同步副本服务器仍然存活,记录就不会丢失,这是最强有力的保证,这相当于acks = -1的设置。
  20. spring.kafka.producer.acks=1
  21. #消费者
  22. #kafka服务器地址
  23. spring.kafka.consumer.bootstrap-servers=xx.xx.xx.xx:9092,xx.xx.xx.xx:9091
  24. #消费组id
  25. spring.kafka.consumer.group-id=DrewGroup
  26. # earliest:当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,从头开始消费
  27. # latest:当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,消费新产生的该分区下的数据
  28. # none:topic各分区都存在已提交的offset时,从offset后开始消费;只要有一个分区不存在已提交的offset,则抛出异常
  29. spring.kafka.consumer.auto-offset-reset=earliest
  30. #是否自动提交偏移量
  31. spring.kafka.consumer.enable-auto-commit=true
  32. #自动提交偏移量的频率
  33. spring.kafka.consumer.auto-commit-interval=100
  34. #消费线程数,即启动的客户端数
  35. spring.kafka.listener.concurrency=2

部分参数配置如下(转自https://blog.csdn.net/fenglibing/article/details/82117166)

  1. #################consumer的配置参数(开始)#################
  2. #如果'enable.auto.commit'为true,则消费者偏移自动提交给Kafka的频率(以毫秒为单位),默认值为5000。
  3. spring.kafka.consumer.auto-commit-interval;
  4. #当Kafka中没有初始偏移量或者服务器上不再存在当前偏移量时该怎么办,默认值为latest,表示自动将偏移重置为最新的偏移量
  5. #可选的值为latest, earliest, none
  6. spring.kafka.consumer.auto-offset-reset=latest;
  7. #以逗号分隔的主机:端口对列表,用于建立与Kafka群集的初始连接。
  8. spring.kafka.consumer.bootstrap-servers;
  9. #ID在发出请求时传递给服务器;用于服务器端日志记录。
  10. spring.kafka.consumer.client-id;
  11. #如果为true,则消费者的偏移量将在后台定期提交,默认值为true
  12. spring.kafka.consumer.enable-auto-commit=true;
  13. #如果没有足够的数据立即满足“fetch.min.bytes”给出的要求,服务器在回答获取请求之前将阻塞的最长时间(以毫秒为单位)
  14. #默认值为500
  15. spring.kafka.consumer.fetch-max-wait;
  16. #服务器应以字节为单位返回获取请求的最小数据量,默认值为1,对应的kafka的参数为fetch.min.bytes。
  17. spring.kafka.consumer.fetch-min-size;
  18. #用于标识此使用者所属的使用者组的唯一字符串。
  19. spring.kafka.consumer.group-id;
  20. #心跳与消费者协调员之间的预期时间(以毫秒为单位),默认值为3000
  21. spring.kafka.consumer.heartbeat-interval;
  22. #密钥的反序列化器类,实现类实现了接口org.apache.kafka.common.serialization.Deserializer
  23. spring.kafka.consumer.key-deserializer=org.apache.kafka.common.serialization.StringDeserializer
  24. #值的反序列化器类,实现类实现了接口org.apache.kafka.common.serialization.Deserializer
  25. spring.kafka.consumer.value-deserializer=org.apache.kafka.common.serialization.StringDeserializer
  26. #一次调用poll()操作时返回的最大记录数,默认值为500
  27. spring.kafka.consumer.max-poll-records;
  28. #################consumer的配置参数(结束)#################
  29. #################producer的配置参数(开始)#################
  30. #procedure要求leader在考虑完成请求之前收到的确认数,用于控制发送记录在服务端的持久化,其值可以为如下:
  31. #acks = 0 如果设置为零,则生产者将不会等待来自服务器的任何确认,该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下,无法保证服务器已收到记录,并且重试配置将不会生效(因为客户端通常不会知道任何故障),为每条记录返回的偏移量始终设置为-1。
  32. #acks = 1 这意味着leader会将记录写入其本地日志,但无需等待所有副本服务器的完全确认即可做出回应,在这种情况下,如果leader在确认记录后立即失败,但在将数据复制到所有的副本服务器之前,则记录将会丢失。
  33. #acks = all 这意味着leader将等待完整的同步副本集以确认记录,这保证了只要至少一个同步副本服务器仍然存活,记录就不会丢失,这是最强有力的保证,这相当于acks = -1的设置。
  34. spring.kafka.producer.acks=1
  35. #每当多个记录被发送到同一分区时,生产者将尝试将记录一起批量处理为更少的请求,
  36. #这有助于提升客户端和服务器上的性能,此配置控制默认批量大小(以字节为单位),默认值为16384
  37. spring.kafka.producer.batch-size=16384
  38. #以逗号分隔的主机:端口对列表,用于建立与Kafka群集的初始连接
  39. spring.kafka.producer.bootstrap-servers
  40. #生产者可用于缓冲等待发送到服务器的记录的内存总字节数,默认值为33554432
  41. spring.kafka.producer.buffer-memory=33554432
  42. #ID在发出请求时传递给服务器,用于服务器端日志记录
  43. spring.kafka.producer.client-id
  44. #生产者生成的所有数据的压缩类型,此配置接受标准压缩编解码器('gzip','snappy','lz4'),
  45. #它还接受'uncompressed'以及'producer',分别表示没有压缩以及保留生产者设置的原始压缩编解码器,
  46. #默认值为producer
  47. spring.kafka.producer.compression-type=producer
  48. #key的Serializer类,实现类实现了接口org.apache.kafka.common.serialization.Serializer
  49. spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.StringSerializer
  50. #值的Serializer类,实现类实现了接口org.apache.kafka.common.serialization.Serializer
  51. spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer
  52. #如果该值大于零时,表示启用重试失败的发送次数
  53. spring.kafka.producer.retries
  54. #################producer的配置参数(结束)#################
  55. #################listener的配置参数(结束)#################
  56. #侦听器的AckMode,参见https://docs.spring.io/spring-kafka/reference/htmlsingle/#committing-offsets
  57. #当enable.auto.commit的值设置为false时,该值会生效;为true时不会生效
  58. #RECORD 每处理一条commit一次
  59. #BATCH(默认) 每次poll的时候批量提交一次,频率取决于每次poll的调用频率
  60. #TIME 每次间隔ackTime的时间去commit(跟auto commit interval有什么区别呢?)
  61. #COUNT 累积达到ackCount次的ack去commit
  62. #COUNT_TIME ackTime或ackCount哪个条件先满足,就commit
  63. #MANUAL listener负责ack,但是会批量提交偏移量
  64. #MANUAL_IMMEDIATE listner负责ack,每调用一次,就立即commit
  65. spring.kafka.listener.ack-mode;
  66. #在侦听器容器中运行的线程数
  67. spring.kafka.listener.concurrency;
  68. #轮询消费者时使用的超时(以毫秒为单位)
  69. spring.kafka.listener.poll-timeout;
  70. #当ackMode为“COUNT”或“COUNT_TIME”时,偏移提交之间的记录数
  71. spring.kafka.listener.ack-count;
  72. #当ackMode为“TIME”或“COUNT_TIME”时,偏移提交之间的时间(以毫秒为单位)
  73. spring.kafka.listener.ack-time;
  74. #################listener的配置参数(结束)#################

3、编写生产者

  1. @Component
  2. public class KafkaProducer {
  3. @Autowired
  4. private KafkaTemplate<String, Object> kafkaTemplate;
  5. public void send(String msg) {
  6. kafkaTemplate.send("DrewTest", msg);
  7. }
  8. }

4、编写消费者

  1. @KafkaListener(topics = "DrewTest", groupId = "DrewGroup")
  2. public void getMsgAndAutoCommit(String msg) {
  3. String name = Thread.currentThread().getName();
  4. System.out.println(name + ":" + msg);
  5. }

5、手动控制消费偏移量提交;

  • 修改enable-auto-commit为false,ack-mode为MANUAL或MANUAL_IMMEDIATE;这里创建了一个config类,目的仅在于示例如何手动配置kafka,你也可以直接修改application.properties

    /**

    • spring内部已经帮我们实现了这一配置类,这里写这个kafka配置类,
    • 只是单纯说明下kafka是如何使用application.properties文件里的参数,
    • 同时如果有需要配置不同kafka参数,例如有些消费者偏移量需手动提交,有些自动提交,
    • 也可以通过配置多个ConcurrentKafkaListenerContainerFactory或KafkaTemplate,
    • 然后在使用时指定。这里示例了如何配置手动提交偏移量
    • @Since:2019年5月22日
    • @Version:1.1.0
      */
      @Configuration
      @EnableKafka
      public class KafkaConfig {
      @Value(“${spring.kafka.producer.bootstrap-servers}”)
      private String servers;

      @Value(“${spring.kafka.producer.retries}”)
      private int retries;

      @Value(“${spring.kafka.producer.batch-size}”)
      private int batchSize;

      @Value(“${spring.kafka.producer.buffer-memory}”)
      private int bufferMemory;

      @Value(“${spring.kafka.consumer.bootstrap-servers}”)
      private String brokers;

      /生产者配置/
      public Map producerConfigs() {

      1. Map<String, Object> props = new HashMap<>();
      2. props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, servers);
      3. props.put(ProducerConfig.RETRIES_CONFIG, 2);
      4. props.put(ProducerConfig.BATCH_SIZE_CONFIG, batchSize);
      5. props.put(ProducerConfig.BUFFER_MEMORY_CONFIG, bufferMemory);
      6. props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
      7. props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
      8. return props;

      }

      public ProducerFactory producerFactory() {

      1. return new DefaultKafkaProducerFactory<>(producerConfigs());

      }

      @Bean
      @Primary
      public KafkaTemplate kafkaTemplate() {

      1. return new KafkaTemplate<>(producerFactory());

      }

      /消费者配置/
      public Map consumerConfigs() {

      1. Map<String, Object> props = new HashMap<>();
      2. props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, brokers);
      3. props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, false);
      4. props.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "100");
      5. props.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, "15000");
      6. props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
      7. props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
      8. props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
      9. return props;

      }

      public ConsumerFactory consumerFactory() {

      1. return new DefaultKafkaConsumerFactory<>(consumerConfigs());

      }

      @Bean
      @Primary
      public ConcurrentKafkaListenerContainerFactory kafkaListenerContainerFactory() {

      1. ConcurrentKafkaListenerContainerFactory<String, Object> factory =
      2. new ConcurrentKafkaListenerContainerFactory<>();
      3. factory.setConsumerFactory(consumerFactory());
      4. factory.setConcurrency(2);
      5. factory.getContainerProperties().setPollTimeout(4000);
      6. //如果enable.auto.commit设为false,但是不设置AckMode,则交由spring自动提交偏移量
      7. factory.getContainerProperties().setAckMode(AckMode.MANUAL);
      8. return factory;

      }

    }

  • 编写消费者

    1. /**
    2. * @param record 消息对象
    3. * @param acknowledgment 偏移量提交类
    4. */
    5. @KafkaListener(topics = "DrewTest", groupId = "DrewGroup")
    6. public void getMsgAndUnAutoCommit(ConsumerRecord<Object, String> record, Acknowledgment acknowledgment) {
    7. System.out.println("key:" + record.key() + "/offset:" + record.offset() + "/value:" + record.value()
    8. + "/partition:" + record.partition() + "/timestamp" + record.timestamp() + "/topics:" + record.topic());
    9. //手动提交偏移量
    10. acknowledgment.acknowledge();
    11. }

6、消费某个时间点之后的数据,这里有两种方法:

  • 一种是创建一个新的group组,设置auto.offset.reset为earliest,在消费时判断时间戳

    @KafkaListener(topics = “DrewTest”, groupId = “DrewGroup1”)

    1. public void getMsgAndUnAutoCommit(ConsumerRecord<Object, String> record, Acknowledgment acknowledgment) {
    2. LocalDateTime dataTime =
    3. LocalDateTime.ofInstant(Instant.ofEpochMilli(record.timestamp()), ZoneId.systemDefault());
    4. //判断时间戳
    5. LocalDateTime time = LocalDateTime.of(2019, 5, 23, 10, 07);
    6. //过滤这个时间点前的数据
    7. if (dataTime.isAfter(time)) {
    8. System.out.println("key:" + record.key() + "/offset:" + record.offset() + "/value:" + record.value()
    9. + "/partition:" + record.partition() + "/timestamp:" + dataTime + "/topics:" + record.topic());
    10. }
    11. //手动提交偏移量
    12. acknowledgment.acknowledge();
    13. }
  • 一种是修改原有group组消费的偏移量,由于根据时间戳设置偏移量需要用到KafkaConsumer这个对象,但是springBoot把这个对象包装维护起来,同时没有提供初始化时根据时间戳设置偏移量的方法,所以我们必须自己创建一个KafkaConsumer对象,而且因为kafka里相同分区不能给同一个group里的不同客户端消费,所以我们在调用以下方法时必须停掉其他所有客户端

    1. /**
    2. * 按groupid和topic修改offset
    3. */
    4. public void updateOffset(String groupId, String topic) {
    5. Map<String, Object> props = new HashMap<>();
    6. props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, brokers);
    7. props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "false");
    8. props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
    9. props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
    10. props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
    11. props.put(ConsumerConfig.GROUP_ID_CONFIG, groupId);
    12. //创建consumer对象
    13. KafkaConsumer consumer = new KafkaConsumer(props);
    14. //订阅topic
    15. consumer.subscribe(Collections.singletonList(topic));
    16. //根据topic获取分区对象
    17. List<PartitionInfo> partitionInfos = consumer.partitionsFor(topic);
    18. //获取8小时前的时间戳
    19. LocalDateTime time = LocalDateTime.now();
    20. time = time.minus(8, ChronoUnit.HOURS);
    21. long fetchDataTime = time.atZone(ZoneId.systemDefault()).toInstant().toEpochMilli();
    22. // 获取每个partition 8个小时之前的偏移量
    23. Map<TopicPartition, Long> timestampsToSearch = new HashMap<>();
    24. for (PartitionInfo partitionInfo : partitionInfos) {
    25. timestampsToSearch.put(new TopicPartition(partitionInfo.topic(), partitionInfo.partition()), fetchDataTime);
    26. }
    27. Map<TopicPartition, OffsetAndTimestamp> map = consumer.offsetsForTimes(timestampsToSearch);
    28. //seek前要先poll,否则会报错
    29. consumer.poll(0);
    30. OffsetAndTimestamp offsetTimestamp = null;
    31. System.out.println("开始设置各分区初始偏移量...");
    32. for (Map.Entry<TopicPartition, OffsetAndTimestamp> entry : map.entrySet()) {
    33. // 如果设置的查询偏移量的时间点大于最大的索引记录时间,那么value就为空
    34. offsetTimestamp = entry.getValue();
    35. if (offsetTimestamp != null) {
    36. int partition = entry.getKey().partition();
    37. long timestamp = offsetTimestamp.timestamp();
    38. long offset = offsetTimestamp.offset();
    39. System.out.println("partition = " + partition + ", time = "
    40. + LocalDateTime.ofInstant(Instant.ofEpochMilli(timestamp), ZoneId.systemDefault()) + ", offset = "
    41. + offset);
    42. // 设置读取消息的偏移量
    43. consumer.seek(entry.getKey(), offset);
    44. }
    45. }
    46. System.out.println("设置各分区初始偏移量结束...");
    47. //提交偏移量
    48. consumer.commitSync();
    49. consumer.close();
    50. }

发表评论

表情:
评论列表 (有 0 条评论,432人围观)

还没有评论,来说两句吧...

相关阅读

    相关 SpringBoot整合kafka

    > 经过前三篇文章 安装jdk 安装zookeeper 以及安装kafka 全部已经竣工了,不知道小伙伴们成功搭建kafka了不。 > 憋了三天的大招,今天放出来吧。今天大家