desc:
使用 spring-kafka 的api,在springboot项目中集成kafka能力,封装配置。
0.引入依赖
<dependency>
<groupId>org.springframework.kafka</groupId>
<artifactId>spring-kafka</artifactId>
</dependency>
1.kafka相关配置
1.1 KafkaConfiguration 公共配置
java">@Data
@Configuration
public class KafkaConfiguration {
/**
* 主机地址
*/
@Value("${kafka.server-host}")
private String bootstrapServers;
/**
* sasl 认证账号
*/
@Value("${iot.kafka.sasl.username:admin}")
private String userName;
/**
* sasl 密码
*/
@Value("${iot.kafka.sasl.password:iot@2021}")
private String password;
}
1.2 KafkaConsumerConfiguration 消费者配置
@Data
@Configuration
public class KafkaConsumerConfiguration {
/**
* 默认组id
*/
@Value("${iot.kafka.consumer.properties.group-id:default-group}")
private String groupId;
@Value("${iot.kafka.consumer.properties.fetch-max-wait:5000}")
private Integer fetchMaxWait;
/**
* 此设置限制每次调用poll返回的消息数,这样可以更容易的预测每次poll间隔要处理的最大值。通过调整此值,可以减少poll间隔,减少重新平衡分组的
*/
@Value("${iot.kafka.consumer.properties.max-poll-record:100}")
private Integer maxPollRecordsConfig;
/**
* 增大poll的间隔,可以为消费者提供更多的时间去处理返回的消息(调用poll(long)返回的消息,通常返回的消息都是一批),缺点是此值越大将会延迟组重新平衡。
*/
@Value("${iot.kafka.consumer.properties.max-poll-interval-ms:100}")
private Integer maxPollIntervalConfig;
/**
* 是否开启自动提交
*/
@Value("${iot.kafka.consumer.properties.enable-auto-***mit:#{false}}")
private boolean enableAuto***mitConfig;
/**
* 消费策略
* earliest 当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,从头开始消费
* latest 当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,消费新产生的该分区下的数据
* none topic各分区都存在已提交的offset时,从offset后开始消费;只要有一个分区不存在已提交的offset,则抛出异常
*/
@Value("${iot.kafka.consumer.properties.auto-offset-reset:earliest}")
private String autoOffsetResetConfig;
@Value("${iot.kafka.consumer.properties.auto-***mit-interval:1000}")
private String auto***mitIntervalMsConfig;
@Value("${iot.kafka.consumer.properties.session-timeout:30000}")
private String sessionTimeoutMsConfig;
}
1.3 KafkaListenerConfiguration 监听配置
@Data
@Configuration
public class KafkaListenerConfiguration {
/**
* 启用线程数(提高并发)
*/
@Value("${iot.kafka.listener.concurrency:3}")
private Integer concurrency;
/**
* 手动提交的方式,当enable-auto-***mit: false时起作用
* manual:手动调用Acknowledgment.acknowledge()后立即提交
* record:当每一条记录被消费者监听器(ListenerConsumer)处理之后提交
* batch:当每一批poll()的数据被消费者监听器(ListenerConsumer)处理之后提交
* time: 当每一批poll()的数据被消费者监听器(ListenerConsumer)处理之后,距离上次提交时间大于TIME时提交
* count:当每一批poll()的数据被消费者监听器(ListenerConsumer)处理之后,被处理record数量大于等于COUNT时提交
* count_time:当每一批poll()的数据被消费者监听器(ListenerConsumer)处理之后, 手动调用Acknowledgment.acknowledge()后提交
*/
@Value("${iot.kafka.listener.ack-mode:manual_immediate}")
private String ackMode;
/**
* 消费超时时间
*/
@Value("${iot.kafka.listener.poll-timeout:3000}")
private Long pollTimeout;
/**
* 是否开启批量处理
*/
@Value("${iot.kafka.listener.batch_listener:#{true}}")
private Boolean batchListener;
}
1.4 KafkaProducerConfiguration 生产者配置
@Data
@Configuration
public class KafkaProducerConfiguration {
/**
* 重试次数 默认值0
*/
@Value("${iot.kafka.producer.retries:0}")
private Integer retries;
/**
* acks = 0 如果设置为零,则生产者将不会等待来自服务器的任何确认,该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下,无法保证服务器已收到记录,并且重试配置将不会生效(因为客户端通常不会知道任何故障),为每条记录返回的偏移量始终设置为 - 1。
* acks = 1 这意味着leader会将记录写入其本地日志,但无需等待所有副本服务器的完全确认即可做出回应,在这种情况下,如果leader在确认记录后立即失败,但在将数据复制到所有的副本服务器之前,则记录将会丢失。
* acks = all 这意味着leader将等待完整的同步副本集以确认记录,这保证了只要至少一个同步副本服务器仍然存活,记录就不会丢失,这是最强有力的保证,这相当于acks = -1 的设置。
*/
@Value("${iot.kafka.producer.acks:all}")
private String acks;
/**
* 指定缓存的大小,生产者缓存每个分区未发送的消息。默认 16384
*/
@Value("${iot.kafka.producer.batch-size:16384}")
private Integer batchSize;
/**
* 生产者发送请求之前等待一段时间,设置等待时间是希望更多地消息填补到未满的批中。 默认 30
*/
@Value("${iot.kafka.producer.properties.linger.ms:30}")
private Integer lingerMs;
/**
* 通过KafkaProducer发送出去的消息都是先进入到客户端本地的内存缓冲里,然后把很多消息收集成一个一个的Batch,再发送到Broker上去的 默认32m
*/
@Value("${iot.kafka.producer.buffer-memory:33554432}")
private Integer bufferMemory;
}
2.工厂配置
2.1 ConsumerFactoryBuilder 消费者工厂
@Configuration
public class ConsumerFactoryBuilder {
@Autowired
private KafkaConfiguration kafkaConfiguration;
@Autowired
private KafkaConsumerConfiguration kafkaConsumerConfiguration;
@Autowired
private KafkaListenerConfiguration kafkaListenerConfiguration;
/**
* 消费者配置
*
* @return properties
*/
@Bean
public Map<String, Object> consumerConfigs() {
Map<String, Object> props = new ConcurrentHashMap<>();
//配置地址
props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, kafkaConfiguration.getBootstrapServers());
//消费者组 默认组id
props.put(ConsumerConfig.GROUP_ID_CONFIG, kafkaConsumerConfiguration.getGroupId());
//是否开启自动提交
props.put(ConsumerConfig.ENABLE_AUTO_***MIT_CONFIG, kafkaConsumerConfiguration.isEnableAuto***mitConfig());
/* 消费策略
* earliest 当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,从头开始消费
* latest 当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,消费新产生的该分区下的数据
* none topic各分区都存在已提交的offset时,从offset后开始消费;只要有一个分区不存在已提交的offset,则抛出异常
*/
props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, kafkaConsumerConfiguration.getAutoOffsetResetConfig());
//消费者默认等待服务响应时间(毫秒)
props.put(ConsumerConfig.FETCH_MAX_WAIT_MS_CONFIG, kafkaConsumerConfiguration.getFetchMaxWait());
props.put(ConsumerConfig.AUTO_***MIT_INTERVAL_MS_CONFIG, kafkaConsumerConfiguration.getAuto***mitIntervalMsConfig());
props.put(ConsumerConfig.SESSION_TIMEOUT_MS_CONFIG, kafkaConsumerConfiguration.getSessionTimeoutMsConfig());
props.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, kafkaConsumerConfiguration.getMaxPollRecordsConfig());
props.put(ConsumerConfig.MAX_POLL_INTERVAL_MS_CONFIG, kafkaConsumerConfiguration.getMaxPollIntervalConfig());
//key序列化器选择
props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.***mon.serialization.StringDeserializer");
//value序列化器选择
props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.***mon.serialization.StringDeserializer");
//设置sasl认证
props.put(***monClientConfigs.SECURITY_PROTOCOL_CONFIG, "SASL_PLAINTEXT");
props.put(SaslConfigs.SASL_MECHANISM, "PLAIN");
props.put(SaslConfigs.SASL_JAAS_CONFIG, "org.apache.kafka.***mon.security.plain.PlainLoginModule required username='" + kafkaConfiguration.getUserName() + "' password='" + kafkaConfiguration.getPassword() + "';");
return props;
}
/**
* kafka消费者工厂
*/
@Bean
public ConsumerFactory<Object, Object> consumerFactory() {
return new DefaultKafkaConsumerFactory(consumerConfigs());
}
/**
* 监听工厂
*/
@Bean
KafkaListenerContainerFactory<ConcurrentMessageListenerContainer<Object, Object>> kafkaListenerContainerFactory() {
ConcurrentKafkaListenerContainerFactory<Object, Object> factory = new ConcurrentKafkaListenerContainerFactory<>();
factory.setConsumerFactory(consumerFactory());
//线程数
factory.setConcurrency(kafkaListenerConfiguration.getConcurrency());
//手动提交
factory.getContainerProperties().setAckMode(ContainerProperties.AckMode.MANUAL);
//开启批量处理
factory.setBatchListener(kafkaListenerConfiguration.getBatchListener());
factory.getContainerProperties().setPollTimeout(kafkaListenerConfiguration.getPollTimeout());
return factory;
}
}
2.2 ProducerFactoryBuilder 生产者工厂
@Configuration
public class ProducerFactoryBuilder {
@Autowired
private KafkaConfiguration kafkaConfiguration;
@Autowired
private KafkaProducerConfiguration kafkaProducerConfiguration;
/**
* 生产者配置
*
* @return 配置
*/
@Bean
public Map<String, Object> producerConfigs() {
Map<String, Object> props = new HashMap<>(11);
//kafka server地址
props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, kafkaConfiguration.getBootstrapServers());
/*
* acks = 0 如果设置为零,则生产者将不会等待来自服务器的任何确认,该记录将立即添加到套接字缓冲区并视为已发送。在这种情况下,无法保证服务器已收到记录,并且重试配置将不会生效(因为客户端通常不会知道任何故障),为每条记录返回的偏移量始终设置为 - 1。
* acks = 1 这意味着leader会将记录写入其本地日志,但无需等待所有副本服务器的完全确认即可做出回应,在这种情况下,如果leader在确认记录后立即失败,但在将数据复制到所有的副本服务器之前,则记录将会丢失。
* acks = all 这意味着leader将等待完整的同步副本集以确认记录,这保证了只要至少一个同步副本服务器仍然存活,记录就不会丢失,这是最强有力的保证,这相当于acks = -1 的设置。
*/
props.put(ProducerConfig.ACKS_CONFIG, kafkaProducerConfiguration.getAcks());
//消息发送失败重试次数
props.put(ProducerConfig.RETRIES_CONFIG, kafkaProducerConfiguration.getRetries());
//去缓冲区中一次拉16k的数据,发送到broker
props.put(ProducerConfig.BATCH_SIZE_CONFIG, kafkaProducerConfiguration.getBatchSize());
// 批量发送,延迟为30毫秒,如果30ms内凑不够batch则强制发送,提高并发
props.put(ProducerConfig.LINGER_MS_CONFIG, kafkaProducerConfiguration.getLingerMs());
//设置缓存区大小 32m
props.put(ProducerConfig.BUFFER_MEMORY_CONFIG, kafkaProducerConfiguration.getBufferMemory());
//key序列化器选择
props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.***mon.serialization.StringSerializer");
//value序列化器选择
props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, "org.apache.kafka.***mon.serialization.StringSerializer");
//设置sasl认证
props.put(***monClientConfigs.SECURITY_PROTOCOL_CONFIG, "SASL_PLAINTEXT");
props.put(SaslConfigs.SASL_MECHANISM, "PLAIN");
props.put(SaslConfigs.SASL_JAAS_CONFIG, "org.apache.kafka.***mon.security.plain.PlainLoginModule required username='" + kafkaConfiguration.getUserName() + "' password='" + kafkaConfiguration.getPassword() + "';");
return props;
}
/**
* Producer Template 配置
*/
@Bean
public KafkaTemplate<String, String> kafkaTemplate() {
Map<String, Object> stringObjectMap = producerConfigs();
DefaultKafkaProducerFactory<String, String> objectObjectDefaultKafkaProducerFactory = new DefaultKafkaProducerFactory<>(stringObjectMap);
return new KafkaTemplate<>(objectObjectDefaultKafkaProducerFactory);
}
}
3.配置文件
需配置 kafka.server-host 其他在代码中均已配置默认值
kafka:
server-host: 192.168.1.113:9048
4.使用示例
@Slf4j
@RestController
@RequestMapping("test")
public class TestController {
@Autowired
private KafkaTemplate<String, String> kafkaTemplate;
@PostMapping("test")
public RestResult test() {
kafkaTemplate.send("TOPIC_NAME", 0, "key", "this is a message");
return RestResult.wrapSu***essResponse();
}
@KafkaListener(topics = "TOPIC_NAME", groupId = "MyGroup1", containerFactory = "kafkaListenerContainerFactory")
public void kafkaListener(List<ConsumerRecord<?, ?>> records, Acknowledgment ack) {
for (ConsumerRecord item : records) {
System.out.printf("topic is %s, offset is %d,partition is %s, value is %s \n", item.topic(), item.offset(), item.partition(), item.value());
log.info("topic is : {}, offset is : {},partition is : {}, value is : {}",item.topic(), item.offset(), item.partition(), item.value());
}
ack.acknowledge();
}
}
-- 230619更正 增加配置文件及默认值说明。
以上。