flume采集log4j日志到kafka

2023-11-06

简单测试项目：

1、新建Java项目结构如下：

测试类FlumeTest代码如下：

package com.demo.flume;

import org.apache.log4j.Logger;

public class FlumeTest {
    
    private static final Logger LOGGER = Logger.getLogger(FlumeTest.class);

    public static void main(String[] args) throws InterruptedException {
        for (int i = 20; i < 100; i++) {
            LOGGER.info("Info [" + i + "]");
            Thread.sleep(1000);
        }
    }
}

监听kafka接收消息Consumer代码如下：

package com.demo.flume;

/**
 * INFO: info
 * User: zhaokai
 * Date: 2017/3/17
 * Version: 1.0
 * History: <p>如果有修改过程，请记录</P>
 */

import java.util.Arrays;
import java.util.Properties;

import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;

public class Consumer {

    public static void main(String[] args) {
        System.out.println("begin consumer");
        connectionKafka();
        System.out.println("finish consumer");
    }

    @SuppressWarnings("resource")
    public static void connectionKafka() {

        Properties props = new Properties();
        props.put("bootstrap.servers", "192.168.1.163:9092");
        props.put("group.id", "testConsumer");
        props.put("enable.auto.commit", "true");
        props.put("auto.commit.interval.ms", "1000");
        props.put("session.timeout.ms", "30000");
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
        consumer.subscribe(Arrays.asList("flumeTest"));
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(100);
            try {
                Thread.sleep(2000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            for (ConsumerRecord<String, String> record : records) {
                System.out.printf("===================offset = %d, key = %s, value = %s", record.offset(), record.key(),
                        record.value());
            }
        }
    }
}

log4j配置文件配置如下：

log4j.rootLogger=INFO,console

# for package com.demo.kafka, log would be sent to kafka appender.
log4j.logger.com.demo.flume=info,flume

log4j.appender.flume = org.apache.flume.clients.log4jappender.Log4jAppender
log4j.appender.flume.Hostname = 192.168.1.163
log4j.appender.flume.Port = 4141
log4j.appender.flume.UnsafeMode = true
log4j.appender.flume.layout=org.apache.log4j.PatternLayout
log4j.appender.flume.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %p [%c:%L] - %m%n
 
# appender console
log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.out
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d [%-5p] [%t] - [%l] %m%n

备注：其中hostname为flume安装的服务器IP，port为端口与下面的flume的监听端口相对应

pom.xml引入如下jar：

<dependencies>
    <dependency>
        <groupId>org.slf4j</groupId>
        <artifactId>slf4j-log4j12</artifactId>
        <version>1.7.10</version>
    </dependency>
    <dependency>
        <groupId>org.apache.flume</groupId>
        <artifactId>flume-ng-core</artifactId>
        <version>1.5.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.flume.flume-ng-clients</groupId>
        <artifactId>flume-ng-log4jappender</artifactId>
        <version>1.5.0</version>
    </dependency>

    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.12</version>
    </dependency>

    <dependency>
        <groupId>org.apache.kafka</groupId>
        <artifactId>kafka-clients</artifactId>
        <version>0.10.2.0</version>
    </dependency>
    
    <dependency>
        <groupId>org.apache.kafka</groupId>
        <artifactId>kafka_2.10</artifactId>
        <version>0.10.2.0</version>
    </dependency>
    
    <dependency>
        <groupId>org.apache.kafka</groupId>
        <artifactId>kafka-log4j-appender</artifactId>
        <version>0.10.2.0</version>
    </dependency>
    
    <dependency>
        <groupId>com.google.guava</groupId>
        <artifactId>guava</artifactId>
        <version>18.0</version>
    </dependency>
</dependencies>

2、配置flume

flume/conf下：

新建avro.conf 文件内容如下：

当然skin可以用任何方式，这里我用的是kafka，具体的skin方式可以看官网

a1.sources=source1
a1.channels=channel1
a1.sinks=sink1

a1.sources.source1.type=avro
a1.sources.source1.bind=192.168.1.163
a1.sources.source1.port=4141
a1.sources.source1.channels = channel1

a1.channels.channel1.type=memory
a1.channels.channel1.capacity=10000
a1.channels.channel1.transactionCapacity=1000
a1.channels.channel1.keep-alive=30

a1.sinks.sink1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.sink1.topic = flumeTest
a1.sinks.sink1.brokerList = 192.168.1.163:9092
a1.sinks.sink1.requiredAcks = 0
a1.sinks.sink1.sink.batchSize = 20
a1.sinks.sink1.channel = channel1

如上配置，flume服务器运行在192.163.1.163上，并且监听的端口为4141，在log4j中只需要将日志发送到192.163.1.163的4141端口就能成功的发送到flume上。flume会监听并收集该端口上的数据信息，然后将它转化成kafka event，并发送到kafka集群flumeTest topic下。

3、启动flume并测试

flume启动命令：bin/flume-ng agent --conf conf --conf-file conf/avro.conf --name a1 -Dflume.root.logger=INFO,console
运行FlumeTest类的main方法打印日志
允许Consumer的main方法打印kafka接收到的数据

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

flume

flume采集log4j日志到kafka 的相关文章

Flume实战

前言在一个完整的大数据处理系统中 xff0c 除了hdfs 43 mapreduce 43 hive组成分析系统的核心之外 xff0c 还需要数据采集结果数据导出任务调度等不可或缺的辅助系统 xff0c 而这些辅助工具在hadoop生
SLF4J: Hbase和Flume的slf4j-log4j12-x.x.xx.jar与hadoop的slf4j-log4j12-x.x.xx.jar冲突

SLF4J Hbase和Flume的slf4j log4j12 x x xx jar与hadoop的slf4j log4j12 x x xx jar冲突文章目录 SLF4J Hbase和Flume的slf4j log4j12 x x xx
Flume系统搭建和使用的一些经验总结-搭建篇

对于很多公司来说日志的收集和集中管理是一个必然要经历的阶段我们公司在经历了一拖再拖之后终于不得不开始搭建日志收集系统了对于日志收集系统我们的首选就是Flume 为何这么坚决呢难道没有其他工具能做个这个事情么当然有不过考虑到
大数据技术面试-Flume、kafka

大数据技术面试 Flume kafka 1 Flume组成有哪些 2 Flume拦截器有哪些知识点 3 Flume采集数据会丢失吗 4 FileChannel如何优化 5 如何控制Kafka丢不丢数据 6 Kafka分区分配策略默认哪两种
day01(Flume)

简介一概述 Flume是Apache提供的一套用于进行日志收集汇聚和传输的框架 2 Flume的版本 Flume ng 和Flume og 不兼容 a Flume1 x Flume ng b Flume0 X Flume og htt
Flume 数据流监控——Ganglia的安装与部署

1 Ganglia的安装 1 安装 dhttpd 服务与 php yasin hadoop102 flume sudo yum y install httpd php 2 安装其他依赖 atguigu hadoop102 flume sud
基于Flume日志收集系统架构和设计(一)

问题导读 1 Flume NG与Scribe对比 Flume NG的优势在什么地方 2 架构设计考虑需要考虑什么问题 3 Agent死机该如何解决 4 Collector死机是否会有影响 5 Flume NG可靠性 reliability
JConsole&VisualVM监控总结

简介 JConsole 以下写作jconsole VisualVM 以下写作jvisualvm 都是比较好的JVM调优工具且都为JDK自带可在命令行直接启动监控示例 Server端需要监控的主机配置设置临时JAVA参数 expo
hadoop学习——flume的简单介绍

flume介绍概述 Flume最早是Cloudera提供的日志收集系统后贡献给Apache 所以目前是Apache下的项目 Flume支持在日志系统中定制各类数据发送方用于收集数据 Flume是一个高可用的高可靠的鲁棒性 robu
flume使用（二）：采集远程日志数据到MySql数据库

本文内容可查看目录本文内容包含单节点单agent 和多节点多agent 采集远程日志说明一环境 linux系统 Centos7 Jdk 1 7 Flume 1 7 0 二安装 linux中jdk mysql的安装不多赘述 fl
调速阀------电磁阀

目录调速阀节流阀简图的理解安装方式注意安装注意事项电磁阀 1 直动式电磁阀 2 分步直动电磁阀 3 先导式电磁阀二位二通电磁阀二位三通电磁阀二位四通电磁阀三位三通电磁阀三位四通电磁阀管道联系式电磁阀直接控制式电磁阀
Flume 学习

开始启动flume的学习 todo
如何在flume中同时使用regex_extractor选择器和多路复用拦截器？

我正在测试 Flume 将数据加载到 hHase 中并考虑使用 Flume 的选择器和拦截器进行并行数据加载因为源和接收器之间的速度差距所以我想要用 Flume 做的是使用拦截器 regexp extract 类型创建事件标头使
Cloudera 5.4.2：使用 Flume 和 Twitter 流时 Avro 块大小无效或太大

当我尝试 Cloudera 5 4 2 时出现了一个小问题基于这篇文章 Apache Flume 获取 Twitter 数据http www tutorialspoint com apache flume fetching twitter
2023_Spark_实验二十九：Flume配置KafkaSink

实验目的掌握Flume采集数据发送到Kafka的方法实验方法通过配置Flume的KafkaSink采集数据到Kafka中实验步骤一明确日志采集方式一般Flume采集日志source有两种方式 1 Exec类型的Source 可
Flume - 整个文件可以被视为 Flume 中的一个事件吗？

我有一个用例需要将目录中的文件提取到 HDFS 中作为 POC 我在 Flume 中使用了简单的目录假脱机其中我指定了源接收器和通道并且它工作得很好缺点是我必须为进入不同文件夹的多种文件类型维护多个目录以便更好地控制文件大小和
Flume的Spool Dir可以在远程机器上吗？

每当新文件到达特定文件夹时我就尝试将文件从远程计算机获取到我的 hdfs 我在flume中遇到了spool dir的概念如果spool dir位于运行flume代理的同一台机器上那么它工作得很好有什么方法可以在远程计算机中配置假脱机
运行 fatjar 时无法加载 log4j2

我正在开发一个使用 log4j2 日志记录的项目在 intellij 中开发时一切正常并且日志记录按预期完成 log4j2 xml 通过在启动时通过 intellij 设置传递给 jvm 的 java 属性进行链接但是一旦我尝试运行
并行读取 Flume spoolDir

由于我不允许在产品服务器上设置 Flume 因此我必须下载日志将它们放入 Flume spoolDir 中并有一个接收器从通道中使用并写入 Cassandra 一切正常但是由于 spoolDir 中有很多日志文件并且当前设置一次仅
如何有效地将数据从 Kafka 移动到 Impala 表？

以下是当前流程的步骤 Flafka http blog cloudera com blog 2014 11 flafka apache flume meets apache kafka for event processing 将日志写入

随机推荐