首页 > 网站技巧 > 服务器 > Linux > linux环境kafka安装及配置

linux环境kafka安装及配置方式

2024-10-06 14:52:11 作者：W_StackOverFlow_W

在Linux环境中安装Kafka需要下载对应版本的资源包,并安装配置Zookeeper,此教程以kafka_2.12-2.5.1版本和apache-zookeeper-3.6.1为例,详细介绍了单体及集群环境下的安装步骤、配置修改、启动验证以及Kerberos认证配置,同时提供了kafka常用命令和注意事项,适合初学者参考

下载资源

1、linux环境安装kafka,需要预先准备相关资源，我使用的是kafka_2.12-2.5.1版本，下载路径为：http://archive.apache.org/dist/kafka/2.5.1/kafka_2.12-2.5.1.tgz，也可以通过命令wget http://archive.apache.org/dist/kafka/2.5.1/kafka_2.12-2.5.1.tgz进行资源获取；

2、获取并安装zookeeper:(以apache-zookeeper-3.6.1-bin.tar.gz为例)，官网：https://zookeeper.apache.org/。

3、将下载好的kafka及zookeeper压缩包上传到虚拟机服务器，放置到/usr/local/目录中：

安装zookeeper

1、解压apache-zookeeper-3.6.1-bin.tar.gz压缩包,并重命名

#进入到压缩包存放路径
cd /usr/local/
#解压
tar -zxvf apache-zookeeper-3.6.1-bin.tar.gz
#重命名
mv apache-zookeeper-3.6.1-bin zookeeper-3.6.1

2、配置启动

#进入配置目录
cd zookeeper-3.6.1/conf/
#复制配置文件，不直接修改源文件用于备份使用
cp zoo_sample.cfg zoo.cfg
#编辑zoo.cfg文件
vi zoo.cfg

修改zoo.cfg中的内容为,主要修改dataDir路径以及端口号：

# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/usr/local/zookeeper-3.6.1/data/
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1

## Metrics Providers
#
# https://prometheus.io Metrics Exporter
#metricsProvider.className=org.apache.zookeeper.metrics.prometheus.PrometheusMetricsProvider
#metricsProvider.httpPort=7000
#metricsProvider.exportJvmInfo=true

3、启动zookeeper

sh /usr/local/zookeeper-3.6.1/bin/zkServer.sh start

4、查看zookeeper状态

sh /usr/local/zookeeper-3.6.1/bin/zkServer.sh status

另：停止zookeeper：

sh /usr/local/zookeeper-3.6.1/bin/zkServer.sh stop

以上为单体zookeeper安装及启动过程，以下为zookeeper集群的搭建方式：

与单体的搭建方式类似，只需要重复类似单体的部署模式，集群最少使用3台，以下大概介绍相应的部署方式：

1、首先将解压好的文件夹复制并重命名

#创建集群目录
mkdir zookeeper-cluster
#将解压好的zookeeper目录复制到集群目录中
cp -r zookeeper-3.6.1 zookeeper-cluster/
#进入集群目录中
cd zookeeper-cluster/
#重命名复制过来的目录为节点1目录，同理复制出节点2和节点3的目录
mv zookeeper-3.6.1 zookeeper-1
cp -r zookeeper-1 ./zookeeper-2
cp -r zookeeper-1 ./zookeeper-3

以下为复制完成后的目录结构：

2、分别配置相关的配置文件，注意节点名称及dataDir路径不要冲突

vi zookeeper-1/conf/zoo.cfg
vi zookeeper-2/conf/zoo.cfg
vi zookeeper-3/conf/zoo.cfg

3、分别创建myid文件到data目录中

echo "1" > zookeeper-1/data/myid
echo "2" > zookeeper-2/data/myid
echo "3" > zookeeper-3/data/myid

修改每个节点中的dataDir，clientPort的值，并增加节点之间的关联属性，以下是节点1的示例，其他节点以此类推：

配置完成后分别启动三个节点：

/usr/local/zookeeper-cluster/zookeeper-1/bin/zkServer.sh start
/usr/local/zookeeper-cluster/zookeeper-2/bin/zkServer.sh start
/usr/local/zookeeper-cluster/zookeeper-3/bin/zkServer.sh start

集群启动成功

连接测试，zkCli.sh脚本可以连接集群测试是否启动成功：

如果（kerberos服务已经安装并配置完成）开启Kerberos认证需要进行以下操作（以单体zookeeper为例）：

1、生成keytab文件：

#登录kerberos的命令行界面
kadmin.local
#生成随机密码
addprinc -randkey zookeeper/hadoop.test.com@TEST.COM
#生成keytab文件
 ktadd -k /etc/security/keytabs/zookeeper.keytab zookeeper/hadoop.test.com@TEST.COM
 #退出命令行
 exit
 #查看生成的keytab文件的用户
 klist -ket /etc/security/keytabs/zookeeper.keytab

以下是执行过程示例：

2、生成jaas文件：

vi /usr/local/zookeeper-3.6.1/conf/jaas.conf

jaas.conf文件内容，注意keyTab属性位置及principal用户名配置正确

Server{
com.sun.security.auth.module.Krb5LoginModule required
useKeyTab=true
storeKey=true
keyTab="/etc/security/keytabs/zookeeper.keytab"
principal="zookeeper/hadoop.test.com@TEST.COM"
useTicketCache=false;
};

Client {
com.sun.security.auth.module.Krb5LoginModule required
useKeyTab=true
keyTab="/etc/security/keytabs/zookeeper.keytab"
storeKey=true
useTicketCache=false
principal="zookeeper/hadoop.test.com@TEST.COM";
};

3、修改配置文件zoo.cfg添加配置，在结尾加入以下配置：

authProvider.1=org.apache.zookeeper.server.auth.SASLAuthenticationProvider
requireClientAuthScheme=sasl
jaasLoginRenew=3600000

4、添加java.env文件，并写入相关的内容，注意-Djava.security.auth.login.config为生成的jaas.conf文件的路径：

echo 'export JVMFLAGS=" -Dsun.security.krb5.debug=true -Djava.security.auth.login.config=/usr/local/zookeeper-3.6.1/conf/jaas.conf"' > /usr/local/zookeeper-3.6.1/conf/java.env

5、启动验证，启动成功，并连接成功

kafka安装及配置

kafka安装（单体）

1、解压安装包

#进入压缩包存放路径
cd /usr/local/
#解压压缩包
tar -zxvf kafka_2.12-2.5.1.tgz
#进入解压后目录中
cd kafka_2.12-2.5.1

2、修改配置

#修改服务配置文件
vi /usr/local/kafka_2.12-2.5.1/config/server.properties

配置中的内容需要配置：

listeners=PLAINTEXT://192.168.4.130:9092
zookeeper.connect=192.168.4.130:2181

配置完成后(前提：zookeeper已正常启动)，即可启动

服务端启动命令(不加-daemon前台启动，关闭即停止服务，加了-daemon后台启动)：

#启动命令
/usr/local/kafka_2.12-2.5.1/bin/kafka-server-start.sh -daemon /usr/local/kafka_2.12-2.5.1/config/server.properties
#停止命令
/usr/local/kafka_2.12-2.5.1/bin/zookeeper-server-stop.sh

查看服务日志命令：

tail -f /usr/local/kafka_2.12-2.5.1/logs/server.log

以上是kafka单体的配置及启动方式。

kafka集群配置方式

本次主要记录同一台服务器上搭建集群，类似于单体的搭建方式，我们只需要配置每个节点的配置文件，然后分别启动即可，如果是分不同的服务器搭建，类似于每台服务器上搭建单体，然后在配置文件中增加相应集群相关的配置项即可使用了，以下默认已经将压缩包解压好后的操作。

1、复制server.properties文件并重命名，复制出3(集群最好大于等于三个节点)份来

#复制配置文件
cp /usr/local/kafka_2.12-2.5.1/config/server.properties /usr/local/kafka_2.12-2.5.1/config/server-1.properties
cp /usr/local/kafka_2.12-2.5.1/config/server.properties /usr/local/kafka_2.12-2.5.1/config/server-2.properties
cp /usr/local/kafka_2.12-2.5.1/config/server.properties /usr/local/kafka_2.12-2.5.1/config/server-3.properties
#编辑配置文件
vi /usr/local/kafka_2.12-2.5.1/config/server-1.properties
vi /usr/local/kafka_2.12-2.5.1/config/server-2.properties
vi /usr/local/kafka_2.12-2.5.1/config/server-3.properties

之后分别配置复制出来的server-1.properties，server-2.properties，server-3.properties三个配置文件，分别配置以下配置

#节点id，不同的节点用不同的数字表示
broker.id=1
#对外的ip及端口，端口号每个文件不要用同一个，我使用的分别是9091,9092,9093
listeners=PLAINTEXT://192.168.4.130:9091
#数据存放位置，每个节点一个如/kafka-logs-1，/kafka-logs-2，/kafka-logs-3等，不同节点使用文件不可重复，如果重复了容易启动失败
log.dirs=/usr/local/kafka_2.12-2.5.1/data/cluster/kafka-logs-1
#填zookeeper的地址，多个用，隔开
zookeeper.connect=192.168.4.130:2181

分别配置好之后可以使用启动命令分别启动相关节点

#启动节点1
/usr/local/kafka_2.12-2.5.1/bin/kafka-server-start.sh -daemon /usr/local/kafka_2.12-2.5.1/config/server-1.properties
#启动节点2
/usr/local/kafka_2.12-2.5.1/bin/kafka-server-start.sh -daemon /usr/local/kafka_2.12-2.5.1/config/server-2.properties
#启动节点3
/usr/local/kafka_2.12-2.5.1/bin/kafka-server-start.sh -daemon /usr/local/kafka_2.12-2.5.1/config/server-3.properties
#查看服务日志
tail -f /usr/local/kafka_2.12-2.5.1/logs/server.log

启动成功日志：

注：有时存在kafka启动失败报zookeeper连接超时拒绝连接时，可能引起的原因是防火墙没有关闭，关闭防火墙的命令，也有可能是/etc/hosts文件配置不对引起的，遇到该问题可以多向考虑。

#方式一
#停止防火墙
service firewalld stop
#禁用防火墙
systemctl disable firewalld
#方式二：
chkconfig iptables off

另：如果之前启动过zookeeper或者kafka,但是数据目录没有清除过的话也会影响我们的启动，一定要仔细核对好。

kafka开启kerberos认证

如果我们搭建的kafka(单体或集群)需要开启kerberos认证，可以在安装的时候这样配置：

1、生成keytab文件：

#登录kerberos的命令行界面
kadmin.local
#生成随机密码
addprinc -randkey kafka/hadoop.test.com@TEST.COM
#生成keytab文件
 ktadd -k /etc/security/keytabs/kafka.keytab kafka/hadoop.test.com@TEST.COM
 #退出命令行
 exit
 #查看生成的keytab文件的用户
 klist -ket /etc/security/keytabs/kafka.keytab

以下是生成过程示例：

2、生成jaas文件：

vi /usr/local/kafka_2.12-2.5.1/config/jaas.conf

jaas.conf文件内容，注意keyTab属性位置及principal用户名配置正确

KafkaServer{
com.sun.security.auth.module.Krb5LoginModule required
useKeyTab=true
storeKey=true
serviceName="kafka"
keyTab="/etc/security/keytabs/kafka.keytab"
principal="kafka/hadoop.test.com@TEST.COM";
};
KafkaClient{
com.sun.security.auth.module.Krb5LoginModule required
useKeyTab=true
storeKey=true
serviceName="kafka"
keyTab="/etc/security/keytabs/kafka.keytab"
principal="kafka/hadoop.test.com@TEST.COM"
userTicketCache=true;
};
Client{
com.sun.security.auth.module.Krb5LoginModule required
useKeyTab=true
storeKey=true
serviceName="kafka"
keyTab="/etc/security/keytabs/kafka.keytab"
principal="kafka/hadoop.test.com@TEST.COM"
userTicketCache=true;
};

3、修改kafka的配置文件,如果是单体仅需要修改一个，如果是集群，则需要修改每个节点对应的配置文件：

vi /usr/local/kafka_2.12-2.5.1/config/server.properties

配置文件中添加（配置）以下的属性(非kerberos配置时需要的配置默认需要配置好)

listeners=SASL_PLAINTEXT://172.168.4.130:9093
advertised.listeners=SASL_PLAINTEXT://172.168.4.130:9093
authorizer.class.name=kafka.security.auth.SimpleAclAuthorizer
security.inter.broker.protocol=SASL_PLAINTEXT
sasl.mechanism.inter.broker.protocol=GSSAPI
sasl.enabled.mechanisms=GSSAPI
sasl.kerberos.service.name=kafka
kafka.security.protocol=SASL_PLAINTEXT
super.users=User:kafka

4、修改kafka服务启动脚本，配置相关的jaas文件路径

vi /usr/local/kafka_2.12-2.5.1/bin/kafka-server-start.sh

添加以下的内容：

export KAFKA_OPTS="-Djava.security.krb5.conf=/etc/krb5.conf -Djava.security.auth.login.config=/usr/local/kafka_2.12-2.5.1/config/jaas.conf"

添加示例：

注意：如果kafka连接时，生产者或消费者连接开启kerberos认证的kafka服务器时，需要在相应的脚本中也同样添加该配置

#生产者连接脚本配置
vi /usr/local/kafka_2.12-2.5.1/bin/kafka-console-producer.sh
#消费者连接脚本配置
vi /usr/local/kafka_2.12-2.5.1/bin/kafka-console-consumer.sh
#topic连接脚本配置
vi /usr/local/kafka_2.12-2.5.1/bin/kafka-topics.sh

同时消费者或生产者的配置文件中需要增加以下配置：

security.protocol=SASL_PLAINTEXT
sasl.mechanism=GSSAPI
sasl.kerberos.service.name=kafka

添加示例（以生产者为例）：

启动kafka服务，连接并使用，参考普通kafka启动及连接相关命令。

kafka自带zookeeper使用

注：kafka安装包中也自带了zookeeper,如果不想安装zookeeper,可以使用kafka安装包中自带的zookeeper。

如果使用kafka安装包中带的zookeeper,需要配置解压后目录中的zookeeper.properties

vi /usr/local/kafka_2.12-2.5.1/config/zookeeper.properties

如果不需要修改端口可以默认不修改，使用命令启动自带zookeeper：

#启动zookeeper
/usr/local/kafka_2.12-2.5.1/bin/zookeeper-server-start.sh -daemon /usr/local/kafka_2.12-2.5.1/config/zookeeper.properties
#停止zookeeper
/usr/local/kafka_2.12-2.5.1/bin/zookeeper-server-stop.sh

如果zookeeper需要开启kerberos认证需要给zookeeper.properties添加配置：

authProvider.1=org.apache.zookeeper.server.auth.SASLAuthenticationProvider
requireClientAuthScheme=sasl
jaasLoginRenew=3600000

在启动脚本zookeeper-server-start.sh中添加如下配置,注意jaas.conf文件的路径，jaas文件生成方式同上。

export KAFKA_OPTS="-Djava.security.krb5.conf=/etc/krb5.conf -Djava.security.auth.login.config=/usr/local/zookeeper-3.6.1/conf/jaas.conf"

启动命令如上。

kafka常用命令

#创建主题
/usr/local/kafka_2.12-2.5.1/bin/kafka-topics.sh --create --zookeeper 192.168.4.130:2181 --replication-factor 1 --partitions 3 --topic test01
#查看主题列表
/usr/local/kafka_2.12-2.5.1/bin/kafka-topics.sh --list --zookeeper 192.168.4.130:2181/kafka
#生产者连接并生产数据
/usr/local/kafka_2.12-2.5.1/bin/kafka-console-producer.sh --broker-list 192.168.4.130:9092  --topic test01 --producer.config /usr/local/kafka_2.12-2.5.1/config/producer.properties
#消费者连接并消费数据
/usr/local/kafka_2.12-2.5.1/bin/kafka-console-consumer.sh --bootstrap-server 192.168.4.130:9092 --topic test01 --from-beginning --consumer.config  /usr/local/kafka_2.12-2.5.1/config/consumer.properties
#kafka添加消息写入partition时间戳的方法
#Kafka消息的时间戳,在消息中增加了一个时间戳字段和时间戳类型。目前支持的时间戳类型有两种： CreateTime 和 LogAppendTime 前者表示producer创建这条消息的时间；后者表示broker接收到这条消息的时间(严格来说，是leader broker将这条消息写入到log的时间)
/usr/local/kafka_2.12-2.5.1/bin/kafka-topics.sh --alter --topic test01 --zookeeper 192.168.4.130:2181 --config  message.timestamp.type=LogAppendTime
/usr/local/kafka_2.12-2.5.1/bin/kafka-console-consumer.sh --bootstrap-server 192.168.4.130:9092 --topic test01 --from-beginning --consumer.config  /usr/local/kafka_2.12-2.5.1/config/consumer.properties --property print.timestamp=true
#删除主题内的消息：kafka-delete-records --bootstrap-server <broker-host:port> --offset-json-file offsets.json
#–bootstrap-server：需要连接的 brokers 地址；
#–offset-json-file：包含删除配置的 Json 文件。
/usr/local/kafka_2.12-2.5.1/bin/kafka-delete-records.sh --bootstrap-server 192.168.4.130:9092 --offset-json-file /usr/local/kafka_2.12-2.5.1/remove.json
#删除附加：移除kerberos开启的server中的数据，同样需要在相关配置文件中配置kerberos相关的配置，以及脚本中增加相关的配置
/usr/local/kafka_2.12-2.5.1/bin/kafka-delete-records.sh --bootstrap-server 192.168.4.130:9092 --command-config /usr/local/kafka_2.12-2.5.1/config/delete-kerb.properties  --offset-json-file /usr/local/kafka_2.12-2.5.1/remove.json

关于移除数据的remove.json配置文件内容：

{
   "partitions": [
                  {"topic": "test01", "partition": 0, "offset": -1}
                 ],
                 "version":1
 }

topic:待删除数据主题
partition：待删除的分区
offset:删除起始偏移量，设置为 -1，表示将删除主题中所有数据。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。