flume 相关问题

Flume是一种分布式,可靠且可用的服务,用于有效地收集,聚合和移动大量日志数据。

Apache Flume从python脚本中获取数据

我正在运行一个python脚本来从新闻提供者收集数据并在flume.conf文件中获取此脚本。我的flume.conf文件:newsAgent.sources = r1 newsAgent.sinks = spark newsAgent.channels = ...

回答 1 投票 0

如何在不指定源的情况下使用Flume的Kafka频道

我有一个现有的Kafka主题和一个从那里读取并写入HDFS的水槽代理。我想重新配置我的水槽代理,这样它就会远离现有的设置;一个卡夫卡来源,档案......

回答 2 投票 3

如何使用flume将.txt文件中的XML数据转换为Avro格式并保存到hdfs

xml数据来自文本文件。将他们的flume和kafka摄取到hdfs并以.txt文件格式保存。退出用例:xml文件通过flume→kafka→flumeintercepter进行摄取(以验证...

回答 2 投票 0

在运行fatjar时无法加载log4j2

我正在开发一个利用log4j2日志记录的项目。在intellij开发时,一切正常,日志记录按预期完成。 log4j2.xml通过传递给...的java属性链接

回答 4 投票 7

java.lang.NoClassDefFoundError:SimpleApp.main中的org / apache / spark / streaming / flume / FlumeUtils(SimpleApp.java:61)

对于项目要求,我试图使用spark示例中的spark来构建FlumUtils示例。我能够创建jar文件。但在尝试执行它时,我得到以下内容......

回答 2 投票 1

如何使用apache flume从txt文件中读取日志

我在使用flume阅读不断增长的.txt文件时遇到了问题。我知道我可以使用例如a1.sources.r1.type = netcat a1.sources.r1.bind = localhost a1.sources ....来读取net中的内容。

回答 1 投票 0

在Kafka阅读消息时重新平衡问题

我正在尝试阅读有关Kafka主题的消息,但我无法阅读它。一段时间后该进程被杀死,无需读取任何消息。以下是我得到的再平衡错误:[2014-03-21 ...

回答 5 投票 16

Apache Flume - 由多个使用者从单个消息队列中提取数据

我目前正在开发Apache Flume代理,可以从单个消息队列(Solace)中提取数据。由于消息处理因大小而缓慢,并且会有很多消息需要摄取,我......

回答 1 投票 0

水槽hdfs水槽的滚动设置

下面是我在flume.conf中的设置:agent.sources = srcpv agent.channels = chlpv agent.sinks = hdfsSink agent.sources.srcpv.type = exec ag ent.sources.srcpv.command = tail -F / var / log / collector /网络/ PV ....

回答 1 投票 0

如何在没有源的情况下使用Kafka频道配置Flume?

如果配置中未指定源,则会抱怨。根据文件:Kafka频道可用于多种场景:使用Flume源和接收器 - 它提供了可靠的...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.