1、Kafka 2 的安装与配置
1、上传kafka_2.12-1.0.2.tgz到服务器并解压:
tar -zxf kafka_2.12-1.0.2.tgz -C /opt
2、配置环境变量并更新:
编辑profile配置文件: vim /etc/profile
#设置kafka的环境变量export KAFKA_HOME=/opt/kafka_2.12-1.0.2export PATH=$PATH:$KAFKA_HOME/bin
重新加载profile文件: source /etc/profile
3、在/opt/kafka_2.12-1.0.2目录中输入kafka-按住tab键,如果能调出其他的指令说明我们配置
profile成功。
4、配置/opt/kafka_2.12-1.0.2/config中的server.properties文件:
> Kafka连接Zookeeper的地址:49.234.5.32:2181,后面的 myKafka 是Kafka在Zookeeper中的根节点路径。
zookeeper.connect=49.234.5.32:2181/mykafka
> 发消息到kafka,kafka会给你进行一个持久化,存储的目录。
Log.dir=/var/niko/kafka/kafka-logs
我们创建这个目录/var/niko/kafka/kafka-logs
mkdir -p /var/niko/kafka/kafka-logs
5、启动zookeeper
进入到/opt/zookeeper-3.4.14/bin目录
cd /opt/zookeeper-3.4.14/bin
启动
zkServer.sh start
6、验证zookeeper:
zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /opt/zookeeper-3.4.14/bin/../conf/zoo.cfg
Mode: standalone 说明成功了
7、启动Kafka:
进入Kafka安装的bin目录,执行如下命令:
cd /opt/kafka_2.12-1.0.2/binkafka-server-start.sh ../config/server.properties
启动成功,可以看到控制台输出的最后一行的started状态:
[2019-07-31 21:18:53,199] INFO [KafkaServer id=0] started (kafka.server.KafkaServer)
8、查看Zookeeper的节点
进入到Zookeeper安装目录的bin目录下
执行 zkCli.sh
执行命令ls / 查看所有的子节点
[mykafka, zookeeper]
9、此时Kafka是前台模式启动,要停止,使用Ctrl+C。
10、如果要后台启动
进入Kafka安装的bin目录,执行如下命令:
cd /opt/kafka_2.12-1.0.2/bin
执行:kafka-server-start.sh -daemon ../config/server.properties
11、查看Kafka的后台进程:ps aux | grep kafka
注意 kafka端口号9092
2、查看kafka是否启动
1、输入指令jps,查看kafka是否启动。
2、在任意目录下以后台的方式启动kafka
kafka-server-start.sh -daemon /opt/kafka_2.12-1.0.2/config/server.properties
3、再次输入jps,查看kafka是否启动成功。
3、在Linux使用命令生产与消费(了解)
3.1、kafka-topics.sh 用于管理主题
# 列出现有的主题(主题是放在zookeeper的节点上的)
kafka-topics.sh --list --zookeeper localhost:2181/mykafka
# 创建主题,该主题包含一个分区,该分区为Leader分区,它没有Follower分区副本。
--partitions 创建的分区个数
--replication-factor 创建的副本个数,用来实现高可用
kafka-topics.sh --zookeeper 49.234.5.32:2181/mykafka --create --topic topic_1 --partitions 1 --replication-factor 1
# 查看指定主题的详细信息
kafka-topics.sh --zookeeper 49.234.5.32:2181/mykafka --describe --topic topic_1
输出结果:
Topic:topic_1 PartitionCount:1 ReplicationFactor:1 Configs:Topic: topic_1 Partition: 0 Leader: 0 Replicas: 0 Isr: 0
#删除指定主题
kafka-topics.sh --zookeeper 49.234.5.32:2181/mykafka --delete --topic topic_1
3.2、kafka-console-producer.sh用于生产消息
kafka-console-producer.sh --topic topic_1 --broker-list 49.234.5.32:9092
3.3、kafka-console-consumer.sh用于消费消息
kafka-console-consumer.sh --bootstrap-server 49.234.5.32:9092 --topic topic_1
开启消费者方式二,从头消费,不按照偏移量消费
kafka-console-consumer.sh --bootstrap-server 49.234.5.32:9092 --topic topic_1 --from-beginning
注意:先开启消费消息,在开启生成消息,这样有生成消息的时候就可以直接消费了。
3.4、查看Kafka所有持久化的数据
进入到我们创建的用来保存持久化数据的目录:
cd /var/niko/kafka/kafka-logs
ls
有下面的偏移量,说明我们使用kafka成功。
__consumer_offsets-22 __consumer_offsets-35 __consumer_offsets-48__consumer_offsets-10 __consumer_offsets-23
4、kafka发送消息的流程
5、Maven项目中使用Kafka开发实战(了解)
1、首先创建一个maven工程,我们将src目录删除,然后再pom.xml文件中设置这个工程的打包方式为pom。
<!-- 这是kafka的工程的父目录 我们使用pom的打包方式--><packaging>pom</packaging>
2、设置工程的maven仓库目录和setting文件。
3、创建子模块producer-consumer-test01 和 producer-product-test01
4、在模块producer-consumer-test01的pom.xml文件中导入依赖。
<dependencies><!-- kafka-clients的依赖--><dependency><groupId>org.apache.kafka</groupId><artifactId>kafka-clients</artifactId><!-- 高版本兼容低版本,我们使用和broker一致的版本 --><version>1.0.2</version></dependency></dependencies>
5.1、生产者
消费者生产消息后,需要broker端的确认,可以同步确认,也可以异步确认。
同步确认效率低,异步确认效率高,但是需要设置回调对象。
package com.wei.producer;import org.apache.kafka.clients.producer.*;
import org.apache.kafka.common.header.Header;
import org.apache.kafka.common.header.internals.RecordHeader;
import org.apache.kafka.common.serialization.IntegerSerializer;
import org.apache.kafka.common.serialization.StringSerializer;import java.nio.charset.StandardCharsets;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;public class MyProducer1 {public static void main(String[] args) throws ExecutionException, InterruptedException {/*** 1.1、KafkaProducer 的创建需要指定的参数* server地址 key的序列化 value的序列化 timeout ack retries*/Map<String,Object> map = new HashMap<>();map.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,"49.234.5.32:9092");map.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, IntegerSerializer.class);map.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class);
// map.put("request.timeout.ms",55);
// map.put(ProducerConfig.ACKS_CONFIG,"all"); //有默认值可以不设置
// map.put(ProducerConfig.RETRIES_CONFIG,3); //也可以不设置
// 1、创建发送消息的类对象KafkaProducerKafkaProducer<Integer, String> producer = new KafkaProducer<>(map);/*** -String topic: 主题* -Integer partition: 分区* -Long timestamp: 时间戳* -K key: key* -V value: value* -Iterable<Header> headers) :用于设置用户自定义的消息头字段**/
// 2.1、创建一个数组,里面存放的都是HeaderArrayList<Header> headers = new ArrayList<>();
// 添加的是Header接口的实现类RecordHeader 通过构造方法实例化一个RecordHeader对象headers.add(new RecordHeader("wode.name","wode.value".getBytes(StandardCharsets.UTF_8)));
// 2、使用producerRecord用来给kafka发送封装的消息ProducerRecord<Integer, String> producerRecord = new ProducerRecord<>("topic_2",0,0,"nihao wudi",headers);
// 3、发送消息
// 消费者生产消息后,需要broker端的确认,可以同步确认,也可以异步确认。
// 同步确认效率低,异步确认效率高,但是需要设置回调对象。
// 3.1、同步发送
// final Future<RecordMetadata> future = producer.send(producerRecord);
// final RecordMetadata recordMetadata = future.get();
// System.out.println("主题是:"+recordMetadata.topic());
// System.out.println("分区是:"+recordMetadata.partition());
// System.out.println("变异量是:"+recordMetadata.offset());
// 3.2、异步发送producer.send(producerRecord, new Callback() {@Overridepublic void onCompletion(RecordMetadata metadata, Exception exception) {if (exception == null) {System.out.println("消息的主题:" + metadata.topic());System.out.println("消息的分区号:" + metadata.partition());System.out.println("消息的偏移量:" + metadata.offset());} else {System.out.println("异常消息:" + exception.getMessage());}}});
// 4、关闭producerproducer.close();}
}
5.2、消费者
package com.lagou.kafka.demo.consumer;import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.serialization.IntegerDeserializer;
import org.apache.kafka.common.serialization.StringDeserializer;import java.util.Arrays;
import java.util.HashMap;
import java.util.Map;
import java.util.function.Consumer;public class MyConsumer2 {public static void main(String[] args) {Map<String, Object> configs = new HashMap<>();// mac的hosts文件中手动配置域名解析configs.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "49.234.5.32:9092");// 使用常量代替手写的字符串,配置key的反序列化器configs.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, IntegerDeserializer.class);// 配置value的反序列化器configs.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);// 配置消费组IDconfigs.put(ConsumerConfig.GROUP_ID_CONFIG, "consumer_demo2");// 如果找不到当前消费者的有效偏移量,则自动重置到最开始// latest表示直接重置到消息偏移量的最后一个configs.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");KafkaConsumer<Integer, String> consumer = new KafkaConsumer<Integer, String>(configs);// 先订阅,再消费consumer.subscribe(Arrays.asList("topic_1"));while (true) {// 如果主题中没有可以消费的消息,则该方法可以放到while循环中,每过3秒重新拉取一次// 如果还没有拉取到,过3秒再次拉取,防止while循环太密集的poll调用。// 批量从主题的分区拉取消息final ConsumerRecords<Integer, String> consumerRecords = consumer.poll(3_000);// 遍历本次从主题的分区拉取的批量消息consumerRecords.forEach(new Consumer<ConsumerRecord<Integer, String>>() {@Overridepublic void accept(ConsumerRecord<Integer, String> record) {System.out.println(record.topic() + "\t"+ record.partition() + "\t"+ record.offset() + "\t"+ record.key() + "\t"+ record.value());}});}// consumer.close();}
}
6、SpringBoot整合 Kafka
1、首先是创建一个springboot-kafka-sum-demo02项目。
2、通过快速构建的方式添加spring-web 、spring-kafka或者是手动在pom.xml文件中添加spring-web 、spring-kafka的依赖。
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency><groupId>org.springframework.kafka</groupId><artifactId>spring-kafka</artifactId>
</dependency>
3、resource目录下的application.properties文件:
#1、设置应用程序的名称和端口号
spring.application.name=springboot-kafka-02
server.port=8080#2、kafka单体或者集群的host和端口号
spring.kafka.bootstrap-servers=49.234.5.32:9092#3、producer的配置
spring.kafka.producer.key-serializer=org.apache.kafka.common.serialization.IntegerSerializer
spring.kafka.producer.value-serializer=org.apache.kafka.common.serialization.StringSerializer
#producer生产者每一批次可以放多少条记录
spring.kafka.producer.batch-size=16384
#生产者端 可以用来发送的缓冲区的大小 32MB 单位是字节
spring.kafka.producer.buffer-memory=33554432#4、consumer的配置
spring.kafka.consumer.key-deserializer=org.apache.kafka.common.serialization.IntegerDeserializer
spring.kafka.consumer.value-deserializer=org.apache.kafka.common.serialization.StringDeserializer
spring.kafka.consumer.group-id=springboot-consumer02
#如果在kafka的消费者中找不到当前的偏移量 从最早的偏移量开始获取数据
spring.kafka.consumer.auto-offset-reset=earliest#消费者的偏移量是自动提交还是手动提交 设置成true表示是自动提交变异量 如果有事务的情况下 我们通常是设置成手动提交
spring.kafka.consumer.enable-auto-commit=true
#消费者设置成自动提交偏移量的一个提交频率
spring.kafka.consumer.auto-commit-interval=1000
4、生产者同步发送消息
package com.wei.springbootkafka.producer;import org.apache.kafka.clients.producer.RecordMetadata;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.kafka.core.KafkaTemplate;
import org.springframework.kafka.support.SendResult;
import org.springframework.util.concurrent.ListenableFuture;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;import java.util.concurrent.ExecutionException;@RestController
public class MyProducer01 {// 1、自动注入KafkaTemplate@Autowiredprivate KafkaTemplate<Integer,String> template;@RequestMapping("/send/sync/{message}")public String sendSyncMessage(@PathVariable("message") String message){
// 2、使用KafkaTemplate发送消息ListenableFuture<SendResult<Integer, String>> future =template.send("spring-topic-01", 0, 0, message);
// 3、同步发送消息 get()try {SendResult<Integer, String> result = future.get();RecordMetadata metadata = result.getRecordMetadata();System.out.println("主题是:"+metadata.topic());System.out.println("分区是:"+metadata.partition());System.out.println("偏移量是:"+metadata.offset());} catch (Exception e) {e.printStackTrace();System.out.println("异常了");}return "success";}
}
5、生产者异步发送消息
@RestController
public class MyProducer02 {// 1、自动注入KafkaTemplate@Autowiredprivate KafkaTemplate<Integer,String> template;@RequestMapping("/send/sync/{message}")public String sendSyncMessage(@PathVariable("message") String message){
// 2、使用KafkaTemplate发送消息ListenableFuture<SendResult<Integer, String>> future =template.send("spring-topic-01", 0, 0, message);
// 3、异步发送消息 future.addCallback(new ListenableFutureCallback<SendResult<Integer, String>>() {@Overridepublic void onFailure(Throwable ex) {System.out.println("失败了"+ex.getMessage());}@Overridepublic void onSuccess(SendResult<Integer, String> result) {RecordMetadata recordMetadata = result.getRecordMetadata();System.out.println("发送消息成功:" + metadata.topic() + "\t" + metadata.partition() + "\t" + metadata.offset());}});return "success";}
}
6、消费者消费消息
package com.wei.springbootkafka.consumer;import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.producer.RecordMetadata;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.kafka.annotation.KafkaListener;
import org.springframework.stereotype.Component;//1、交由spring进行管理
@Component
public class MyConsumer01 {
// 2、KafkaListener监听指定的主题@KafkaListener(topics="spring-topic-01")
// 3、添加了@KafkaListener注解后 方法中就可以使用ConsumerRecord:用来接收kafka的消息public void getMessage(ConsumerRecord<Integer,String> record){System.out.println("consumer"+ record.topic()+"\t"+ record.partition()+"\t"+ record.offset()+"\t"+ record.key()+"\t"+ record.value()+"\t");}
}
7、kafka报错 UnknownHostException 解决方案
运行springboot和kafka整合项目报错java.net.UnknownHostException: VM-4-7-centos
解决方案:
1、cd 到/opt/kafka_2.12-1.0.2/config目录下
2、vim server.properties
设置成listeners=PLAINTEXT://VM-4-7-centos:9092
3、通过查看 linux服务器的 /etc/hosts 文件:将VM-4-7-centos指向的就是linux服务器ip。
127.0.0.1 VM-4-7-centos VM-4-7-centos
49.234.5.32 VM-4-7-centos VM-4-7-centos
4、由于我是在本机服务中访问到了linux服务器上的kafka服务,自然就无法解析到 VM-4-7-centos。因此需要在本机的hosts文件中也加入相应的配置!
5、Mac系统的hosts 文件就在 /etc/hosts 路径里,我们直接是无法编辑的,需要通过下面的方法来修改我们的 hosts 文件。
进入终端(命令窗口)里,输入 sudo vi /etc/hosts ,回车后再输入密码,再回车就可以打开我们的hosts文件了。
添加VM-4-7-centos 的服务器的ip地址:
49.234.5.32 VM-4-7-centos