avro 相关问题

Apache Avro是一个主要用于Apache Hadoop的数据序列化框架。

为什么kafka-avro-console-producer不支持该字段的默认值?

虽然默认是为字段定义的,但kafka-avro-console-producer完全忽略它:$ kafka-avro-console-producer --broker-list localhost:9092 --topic test-avro \ --property schema.registry .. ..

回答 2 投票 1

从Python 3和Avro 1.7.6开始,步骤是什么? (Q&A)

这是一个Q&A,这意味着我正在分享我遇到的问题的解决方案/答案:问题是来自apache网站的入门指南并非完全是最新的,并且经过一段时间...

回答 2 投票 2

Avro序列化json文档缺少字段的麻烦

我正在尝试使用Apache Avro将从Elastic Search导出的数据的模式强制执行到HDFS中的许多Avro文档中(使用Drill进行查询)。我在使用Avro默认设置时遇到了一些麻烦......

回答 1 投票 6

为什么kafka-avro-console-consumer不显示缺失字段的默认值?

好吧,现在我有点沮丧,因为我已经问了一个相关问题:为什么kafka-avro-console-producer不遵守该字段的默认值?如果生产者使用......

回答 1 投票 0

在Avro Serde的hive表中摄取小数

我试图检查是否可以使用Avro Serde更改配置单元中的十进制字段的精度和比例。所以我写了下面的代码。 create database test_avro;使用test_avro_table;创造外部......

回答 1 投票 0

Nifi中的ExecuteSQL处理器以avro格式返回数据

刚开始使用Apache Nifi。我试图从oracle获取数据并将其放在HDFS中,然后在它上面构建一个外部hive表。问题是ExecuteSQL处理器返回数据...

回答 1 投票 0

数字值未在Kafka使用者CLI中显示

通过运行Confluent 5.1.0将数据从Avro文件写入主题。当我运行Kafka使用者命令时,数值不显示。 Ptns-MacBook-Pro:kafka_2.12-2.1.0 ptn $ bin / kafka-console -...

回答 1 投票 0

拼花,avro和其他hadoop文件格式可以为第一行设置不同的布局吗?

为什么我必须将RDD转换为DF才能将其写为镶木地板,avro或其他类型?我知道编写RDD,因为不支持这些格式。我实际上是想用...写一个镶木地板文件

回答 1 投票 0

如何阅读和操作Avro架构(avsc格式)

我想使用Avro架构并在python中读取它。无法读取架构。它从avro.datafile导入DataFileReader,来自avro.io import的DataFileWriter抛出错误导入avro.schema ...

回答 1 投票 0

使用可选值生成avro架构

我正在尝试编写一个非常简单的avro架构(很简单因为我只是指出我当前的问题)来编写基于json格式存储的数据的avro数据文件。诀窍是一个领域是......

回答 1 投票 6

如何在JSON avro架构中创建枚举数组?

我想有一个avro架构,其中有一个名为validExtensions的字段。如何让validExtensions接受枚举扩展名列表?我在枚举中创建了一个可接受的扩展名列表:...

回答 1 投票 1

Avro Schema - 什么是“avro.java.string”:“String”

我已将AUTO_REGISTER_SCHEMAS的Kafka Streams处理配置设置为true。我在这个自动生成的模式中注意到它创建了以下两种类型{“name”:“id”,“type”:...

回答 1 投票 1

使用C#反序列化Avro文件

我找不到用C#反序列化Apache Avro文件的方法。 Avro文件是Microsoft Azure Event Hub中的存档功能生成的文件。使用Java我可以使用Apache的Avro工具来...

回答 5 投票 12

将avro转换为镶木地板(使用配置单元可能吗?)

我正在尝试将存储在HDFS(100s的GB)上的一堆多部分avro文件转换为镶木地板文件(保留所有数据)Hive可以使用以下命令将avro文件作为外部表读取:CREATE EXTERNAL ...

回答 1 投票 0

Java Kafka消费者和avro deserialzier

我正在开发一个带有spark流的简单java。我配置了kafka jdbc连接器(postgres到主题),我想用火花流消费者阅读它。我能够正确阅读主题......

回答 2 投票 1

如何在Spark中创建一个空的dataFrame

我有一组基于Avro的hive表,我需要从中读取数据。由于Spark-SQL使用hive serdes从HDFS读取数据,因此它比直接读取HDFS慢得多。所以我用过数据......

回答 4 投票 1

在Avro中声明一个简单时间戳的正确方法是什么

我们怎样才能在Avro中声明一个简单的时间戳。类型:时间戳不起作用。所以我实际上使用了一个简单的字符串,但我希望它作为时间戳。 (这是我的变量:27/01/1999 08:45:34)谢谢......

回答 1 投票 1

民意调查来自卡夫卡的几条消息

我正在使用confluent_kafka包与Kafka合作。我以这种方式创建主题:来自confluent_kafka从confluent_kafka.avro导入avro导入AvroProducer def my_producer():...

回答 2 投票 2

如何获得Avro架构验证以支持字段别名?

我在Avro序列化的记录中重命名了一个字段。我想支持读取旧版本的数据,而不需要架构注册表。因此,我将架构的所有版本保留为资源...

回答 1 投票 1

使用自定义列名称将Avro文件加载到具有嵌套记录的GCS

我试图加载带有嵌套记录的Avro文件。其中一项记录是架构联盟。加载到BigQuery时,它创建了一个非常长的名称,如com_mycompany_data_nestedClassname_value ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.