apache-flink 相关问题

Apache Flink是一个用于可扩展批处理和流数据处理的开源平台。 Flink在一个系统中支持批量和流分析。分析程序可以用Java和Scala中简洁优雅的API编写。

从IDE运行flink时如何设置presto.s3.xxx属性?

我能够成功运行我的flink作业,使用./bin/flink run保存到S3 ....为此,我必须将flink-s3-fs-presto jar复制到$ FLINK_HOME / lib文件夹我也不得不......

回答 2 投票 0

如何从一个源来有效地计算多个flink流

例如:有一个视频播放日志,格式为:user_id,video_id,play_duration,video_duration,country,request_date我想要计算:a。最后一分钟的比赛次数b。 ...

回答 1 投票 0

无论窗口时间如何,都可以在Apache Flink中组合两个流

我有两个想要组合的数据流。问题是一个数据流的频率比另一个高得多,并且有时一个流根本没有接收事件。是......

回答 1 投票 13

将DataSet数据发送到elasticsearch

我正在尝试使用新的elasticsearch连接器将一些数据从DataSet发送到elasticsearch,但除了数据流结构之外我找不到任何资源:https://ci.apache ....

回答 1 投票 0

在Flink集群中使用Log4j记录问题?

我有一个程序,其中Log4j用于记录一些信息。当我在IDE / Intellij中测试时,日志文件可以成功生成。而当我提交这个任务来flink独立集群。一世 ...

回答 2 投票 4

Apache Flink - 活动时间

我想为Apache flink中的事件创建一个事件时钟。我按照以下方式执行此操作:公共类TimeStampAssigner实现AssignerWithPeriodicWatermarks

回答 1 投票 0

Confluent JDBC连接器和Flink消费者

我们正在尝试将SQL-Server JDBC Connector与KafkaAvroSerializer一起使用,并在将数据发送到Kafka之前提供Customized ProducerInterceptor来加密数据。在消费者方面,我们想要使用......

回答 1 投票 0

根据Scala flink中的另一个DataSet过滤DataSet

我试图复制这个python代码:cond_entropy_x = np.array([entr(x [y == v])for v in uy])其中x和y是向量,uy是y上的唯一值,例如0,1。在flink,我......

回答 1 投票 1

在flink流sql中查询和更新流

我正在寻找一个基于flink的解决方案,情况是我有一个trans流和一些可以表示为SQL的规则,我想在查询后更新流(如果匹配ruleSql1设置...

回答 1 投票 -1

Flink WindowFunction折叠

我创建了一个滑动窗口,并希望递归打包所有元素进入该窗口期间,这是代码的一部分.map(x =>((x.pickup.get.latitude,x.pickup.get.longitude),( x.dropoff ....

回答 1 投票 0

为什么stop-cluster.sh会停止最新启动的Flink集群?

我计划从Flink 1.5.2升级到1.6.0,然后进行作业迁移。为了减少作业的暂停时间,我计划在......之后同时运行两个Flink集群。

回答 1 投票 1

Flink SQL:在GROUP BY查询结果中重复分组键

我想在一个表中的Flink SQL中进行一个简单的查询,其中包含一个group by语句。但是在结果中,group by语句中指定的列存在重复的行。就是它 ...

回答 1 投票 0

配置Flink作业/任务管理器度量标准的端口

我在Amazon EMR中运行Flink。在flink-conf.yaml中,我有metrics.reporter.prom.port:9249-9250根据作业管理器和任务管理器是否在同一节点中运行,任务管理器......

回答 1 投票 0

如何在不同的节点上运行Flink作业管理器和任务管理器?

我在纱线上有一个长期运行的Flink集群。这是启动它的命令sudo -E flink run -m yarn-cluster -ynm FlinkStreamBootstrap -yn 2 -s $ {SAVEPOINT} -d -c flink.FlinkBootstrap $ {FLINK_LIB} / ...

回答 1 投票 0

在Apache Flink中读取超过22列的CSV

我到目前为止所做的是读取CSV如下:val data = env.readCsvFile [ElecNormNew](getClass.getResource(“/ elecNormNew.arff”)。getPath)val dataSet = data map {tuple => val list = ...

回答 1 投票 0

确定哪个对象在Apache-Flink中不可序列化

我正在写一个Flink变换器,我有一个自定义对象直方图,具有以下属性:case class Histogram(nRows:Int,nCols:Int,min:Int,step:Double,private val ...

回答 1 投票 0

Flink kafka - Flink作业不向不同的分区发送消息

我有以下配置:一个带有2个分区的kafka主题一个zookeeper实例一个kafka实例两个具有相同组ID的消费者Flink作业代码段:speStream.addSink(new ...

回答 2 投票 2

在Apache Flink中从Kafka头读取数据的方法

我有一个项目,我从Kafka消费数据。显然,有几个字段将包含在标题中,我还需要为每条消息阅读。有没有 ...

回答 2 投票 2

Flink:如何将DataSet写入变量而不是文件中

我有一个使用DataSet API在Scala中编写的flink批处理程序,该程序会生成我感兴趣的最终数据集。我希望将该数据集作为变量或值(例如列表或...

回答 2 投票 3

未找到org.apache.flink.api.common.serialization.DeserializationSchema的类文件

我正在尝试开发一个flink流工作。这份工作应该从kafka主题中读取。我试图在https://github.com/dataArtisans/kafka-example/blob/master/src/main/java/com /上更新示例。

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.