CentOS6.5 安装Kafka集群

250次阅读

没有评论

共计 3123 个字符，预计需要花费 8 分钟才能阅读完成。

1、安装 Zookeeper

参考文档：http://www.linuxidc.com/Linux/2016-05/131867.htm

2、下载：https://www.apache.org/dyn/closer.cgi?path=/kafka/0.9.0.1/kafka_2.10-0.9.0.1.tgz

kafka_2.10-0.9.0.1.tgz #2.10 指的中 Scala 版本，0.9.0.1 批的是 Kafka 版本。

3、安装与配置

解压：tar xzf kafka_2.10-0.9.0.1.tgz

配置 config/server.properties

 [root@Hadoop-NN-01 config]# vim server.properties
 
broker.id=1         # 唯一，填数字 
port=9092           # 端口 
host.name=Hadoop-NN-01      # 唯一，填服务器 IP
socket.send.buffer.bytes=1048576
socket.receive.buffer.bytes=1048576
socket.request.max.bytes=104857600
log.dir=/home/hadoopuser/kafka-logs         # 设置日志的硬盘路径 
num.partitions=1            # 分区数 关于分区数：1 天有 1 亿行可以分 8 个分区，如果每天几十万行就一个分区。
num.io.threads=8            # 为机器的核数 
zookeeper.connect=Zookeeper-01:2181,Zookeeper-02:2181,Zookeeper-03:2181    # zookeeper Servers 列表，各节点以逗号分开。

4、配置环境变量（如果单节点多个 Broker 请不要配置）

 [root@Hadoop-NN-01 ~]# vim /etc/profile
export KAFKA_HOME=/home/hadoopuser/kafka_2.10-0.9.0.1
export PATH=$PATH:$KAFKA_HOME/bin
 
[root@Hadoop-NN-01 ~]# source /etc/profile    #使环境变量生效

5、启动 kafka

[root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-server-start.sh config/server.properties &

6、验证

jps 查看一下 kafka 是否已经启动

7、创建 topic：

[root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-topics.sh --create --zookeeper Zookeeper-01:2181, Zookeeper-02:2181, Zookeeper-03:2181 --replication-factor 3 --partitions 1 --topic mykafka

8、查看 Topic：

 [root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-topics.sh --list --zookeeper Zookeeper-01:2181, Zookeeper-02:2181, Zookeeper-03:2181
 
Topic：mykafka

查看详细信息：

 [root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-topics.sh --describe --zookeeper Zookeeper-01:2181, Zookeeper-02:2181, Zookeeper-03:2181
 
Topic: mykafka   PartitionCount:1 ReplicationFactor:3   Configs:
Topic: mykafka   Partition: 0   Leader: 3      Replicas: 3,1,2     Isr: 3,1,2

9、发送消息：

[root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-console-producer.sh --broker-list Hadoop-NN-01:9092 --topic mykafka

CentOS6.5 安装 Kafka 集群

10、接收消息：

[root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-console-consumer.sh --zookeeper Zookeeper-01:2181 --topic mykafka --from-beginning

CentOS6.5 安装 Kafka 集群

注：如果要最新的数据，不带 –from-beginning 参数即可。

11、可能出现的错误

ERROR：Failed to load class “org.slf4j.impl.StaticLoggerBinder”

解决方法：

下载 slf4j-1.7.6.zip wget http://www.slf4j.org/dist/slf4j-1.7.6.zip

把 slf4j-nop-1.7.6.jar 包复制到 kafka libs 目录下面

12、关于 Kafka：

在 kafka 的核心思路中，不需要在内存里缓存数据，因为操作系统的文件缓存已经足够完善和强大，只要不做随机写，顺序读写的性能是非常高效的。kafka 的数据只会顺序 append，数据的删除策略是累积到一定程度或者超过一定时间再删除。

Kafka 另一个独特的地方是将消费者信息保存在客户端而不是 MQ 服务器，这样服务器就不用记录消息的投递过程，每个客户端都自己知道自己下一次应该从什么地方什么位置读取消息，消息的投递过程也是采用客户端主动 pull 的模型，这样大大减轻了服务器的负担。

Kafka 还强调减少数据的序列化和拷贝开销，它会将一些消息组织成 Message Set 做批量存储和发送，并且客户端在 pull 数据的时候，尽量以 zero-copy 的方式传输，利用 sendfile(对应 Java 里的 FileChannel.transferTo/transferFrom) 这样的高级 IO 函数来减少拷贝开销。可见，kafka 是一个精心设计，特定于某些应用的 MQ 系统，这种偏向特定领域的 MQ 系统我估计会越来越多，垂直化的产品策略值的考虑。

附：推荐几个实时监控数据

zookeeper -> zooinspector

kafka-> kafkaoffsetmonitor

storm-> storm ui

相关阅读 ：

分布式发布订阅消息系统 Kafka 架构设计 http://www.linuxidc.com/Linux/2013-11/92751.htm

Apache Kafka 代码实例 http://www.linuxidc.com/Linux/2013-11/92754.htm

Apache Kafka 教程笔记 http://www.linuxidc.com/Linux/2014-01/94682.htm

Apache kafka 原理与特性 (0.8V) http://www.linuxidc.com/Linux/2014-09/107388.htm

Kafka 部署与代码实例 http://www.linuxidc.com/Linux/2014-09/107387.htm

Kafka 介绍和集群环境搭建 http://www.linuxidc.com/Linux/2014-09/107382.htm

更多 CentOS 相关信息见 CentOS 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=14

本文永久更新链接地址 ：http://www.linuxidc.com/Linux/2016-05/131870.htm

正文完

星哥玩云-微信公众号

发表至：服务器应用

2022-01-21

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

RHEL6.4中使用Cacti+Spine监控主机实现发送邮件报警

CentOS安装部署PHP环境

DRBD 的日常管理

使用Jenkins部署.Net应用程序

为部署ASP.NET Core准备：使用Hyper-V安装Ubuntu Server 16.10

Python 操作LDAP实现用户统一认证密码修改功能

Phoenix 3.1 + HBase 0.94.21 的安装和使用

Hadoop HDFS负载均衡

docker-gitlab搭建使用及问题解决

CentOS6.5 安装Kafka集群

申请腾讯混元的API Key并且使用LobeChat调用混元AI

Docker部署搭建一个开源强大的图书管理系统

基于Docker快速搭建一个开源的IT人员在线工具箱-it-tools

让每个人都可以轻松使用Git-腾讯自研Git客户端

使用Docker部署开源的WPS-Office

阿里云和腾讯云哪个好？服务器哪个速度快？

解析Linux中出现的错误：toomanyopenfiles

ifconfig已过时，来看看现在的新命令！

Bash 的路径补全功能

zabbix监控运维使用zatree扩展

	[root@Hadoop-NN-01 config]# vim server.properties

	broker.id=1 # 唯一，填数字
	port=9092 # 端口
	host.name=Hadoop-NN-01 # 唯一，填服务器 IP
	socket.send.buffer.bytes=1048576
	socket.receive.buffer.bytes=1048576
	socket.request.max.bytes=104857600
	log.dir=/home/hadoopuser/kafka-logs # 设置日志的硬盘路径
	num.partitions=1 # 分区数关于分区数：1 天有 1 亿行可以分 8 个分区，如果每天几十万行就一个分区。
	num.io.threads=8 # 为机器的核数
	zookeeper.connect=Zookeeper-01:2181,Zookeeper-02:2181,Zookeeper-03:2181 # zookeeper Servers 列表，各节点以逗号分开。

	[root@Hadoop-NN-01 ~]# vim /etc/profile
	export KAFKA_HOME=/home/hadoopuser/kafka_2.10-0.9.0.1
	export PATH=$PATH:$KAFKA_HOME/bin

	[root@Hadoop-NN-01 ~]# source /etc/profile #使环境变量生效

	[root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-topics.sh --list --zookeeper Zookeeper-01:2181, Zookeeper-02:2181, Zookeeper-03:2181

	Topic：mykafka

	[root@Hadoop-NN-01 kafka_2.10-0.9.0.1]$ bin/kafka-topics.sh --describe --zookeeper Zookeeper-01:2181, Zookeeper-02:2181, Zookeeper-03:2181

	Topic: mykafka PartitionCount:1 ReplicationFactor:3 Configs:
	Topic: mykafka Partition: 0 Leader: 3 Replicas: 3,1,2 Isr: 3,1,2