Flume的安装与Flume监控端口数据官方案例

目录

一:安装准备

二:安装步骤

三.验证安装与Flume监控端口数据官方案例


Flume是一个分布式、可靠、和高可用的海量日志采集、聚和和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接收方(比如文本、HDFS、Hbase等)的能力。

一:安装准备

虚拟机上已经安装jdk和hadoop

jdk安装参考:Linux系统CentOS7安装jdk_一个人的牛牛的博客-CSDN博客

hadoop安装参考:Hadoop全分布式的安装--hadoop-2.7.3_一个人的牛牛的博客-CSDN博客

1.1官网地址

http://flume.apache.org/

1.2下载地址

http://archive.apache.org/dist/flume/

或者

https://mirrors.tuna.tsinghua.edu.cn/apache/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz

二:安装步骤

2.1将下载好的Flume安装包上传到Linux系统的hadoop01上。

连接工具:MobaXterm_Portable

直接把apache-flume-1.9.0-bin.tar.gz拖到MobaXterm_Portable的框框里就行。

操作参考:MobaXterm_Portable的简单使用_一个人的牛牛的博客-CSDN博客

2.2解压安装

新建training文件夹

mkdir /training

进入apache-flume-1.9.0-bin.tar.gz所在的文件夹/tools,执行

tar -zvxf apache-flume-1.9.0-bin.tar.gz -C /training/

2.3配置环境变量

vi ~/.bash_profile
#flume
export FLUME_HOME=/training/apache-flume-1.9.0-bin
export PATH=$PATH:$FLUME_HOME/bin

2.4环境变量生效

source ~/.bash_profile

2.5修改配置文件

apache-flume-1.9.0-bin/conf下的flume-env.sh.template文件修改为flume-env.sh,并配置flume-env.sh文件。

cp flume-env.sh.template flume-env.sh

进入flume-env.sh文件

vi flume-env.sh

添加

export JAVA_HOME=/training/jdk1.8.0_171

三.验证安装与Flume监控端口数据官方案例

3.1安装netcat工具

sudo yum install nc

3.2判断44444端口是否被占用,如果没有被占用,那么这个将不会有输出

sudo netstat -tunlp | grep 44444

3.3创建Flume Agent配置文件netcat-flume-logger.conf 

3.3.1在flume目录下创建job文件夹并进入job文件夹;

mkdir job
cd job/

3.3.2在job文件夹下创建Flume Agent配置文件netcat-flume-logger.conf;

vi netcat-flume-logger.conf

内容:

#Name the components on this agent
# a1代表着我们的agent的命名
# r1、k1、c1 分别代表我们的source sink channel
a1.sources = r1
a1.sinks = k1
a1.channels = c1
 
# Describe/configure the source
# 这是source的配置
a1.sources.r1.type = netcat
a1.sources.r1.bind = hadoop001
a1.sources.r1.port = 44444
 
# Describe the sink
# sink的配置
a1.sinks.k1.type = logger
 
# Use a channel which buffers events in memory
# 这个地方是channel的配置, 使用的是内存作为缓存
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
 
# Bind the source and sink to the channel
# source channel sink三个组件绑定的配置
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

3.3.3开启flume监听端口

bin/flume-ng agent -c conf/ -n a1 -f job/netcat-flume-logger.conf -Dflume.root.logger=INFO,console

 

 

3.3.4使用netcat工具向本机的44444端口发送内容(在另一个窗口操作)

nc hadoop001 44444

 内容:

hello world
i like jeffry
i love china
i am Chinese

3.3.5在Flume监听页面观察接收数据情况

 完成!!!!!!!!

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>