Apache Flume - 下载安装和环境设置

我们在上一章中已经讨论了 Flume 的架构。 在本章中,我们将了解如何下载和设置 Apache Flume。

在继续之前,您的系统中需要有一个Java环境。所以首先,请确保您的系统中安装了Java。在本教程中的一些示例中,我们使用了Hadoop HDFS(作为接收器)。 因此,我们建议您安装 Hadoop 和 Java。 要收集更多信息,请点击链接 − https://www.tutorialspoint.com/hadoop/hadoop_enviornment_setup.htm

官网下载 Flume

首先,从官网 https://flume.apache.org/ 下载最新版本的Apache Flume软件。

安装 Flume

步骤 1

打开网站。 单击主页左侧的download链接。 它将带您进入 Apache Flume 的下载页面。

安装 Flume

步骤 2

在下载页面中,您可以看到 Apache Flume 的二进制文件和源文件的链接。 点击链接 apache-flume-1.6.0-bin.tar.gz

您将被重定向到镜像列表,您可以通过单击其中任意镜像来开始下载。 同样,点击 apache-flume-1.6.0-src.tar.gz 即可下载Apache Flume的源码。

步骤 3

HadoopHBase等软件的安装目录(如果已经安装)的同一目录下创建一个名为Flume的目录如下所示。

$ mkdir Flume 

步骤 4

解压下载的 tar 文件,如下所示。

$ cd Downloads/ 
$ tar zxvf apache-flume-1.6.0-bin.tar.gz  
$ tar zxvf apache-flume-1.6.0-src.tar.gz

步骤 5

将 apache-flume-1.6.0-bin.tar 文件的内容移至之前创建的 Flume 目录,如下所示。 (假设我们已经在名为Hadoop的本地用户中创建了Flume目录。)

$ mv apache-flume-1.6.0-bin.tar/* /home/Hadoop/Flume/

配置 Flume

要配置Flume,我们必须修改三个文件,即flume-env.sh、flumeconf.propertiesbash.rc

设置 Path / Classpath

.bashrc 文件中,设置 Flume 的主文件夹、路径和类路径,如下所示。

设置路径

conf 文件夹

如果打开Apache Flume的conf文件夹,将会有以下四个文件 −

  • flume-conf.properties.template,
  • flume-env.sh.template,
  • flume-env.ps1.template, and
  • log4j.properties.
conf 文件夹

现在重命名

  • flume-conf.properties.template 文件为 flume-conf.properties

  • flume-env.sh.templateflume-env.sh

flume-env.sh

打开flume-env.sh文件并将JAVA_Home设置为系统中安装Java的文件夹。

flume-env.sh

验证安装

通过浏览 bin 文件夹并键入以下命令来验证 Apache Flume 的安装。

$ ./flume-ng 

如果您已成功安装 Flume,您将收到如下所示的 Flume 帮助提示。

验证安装