orc 相关问题

优化行列式(ORC)文件格式提供了一种存储Hive数据的高效方法。它旨在克服其他Hive文件格式的限制。当Hive读取,写入和处理数据时,使用ORC文件可以提高性能。

带有ORC表的Azure SQL数据仓库(Synapse Analytics)Polybase性能

我在Azure存储帐户(带有ADLS Gen2功能)上使用Spark(数据砖)生成了一个ORC表(使用Snappy压缩)。这个ORC代表大约12 GB的数据(12亿行)。该表具有...

回答 1 投票 0

分区的ORC表在Hive中显示为空

我已将Spark数据帧写入分区的ORC文件,如下所示:df.repartition(“ LOADED”)\ .write \ .partitionBy(“ LOADED”)\ .format(“ orc”)\ .save(“ location” )一切都在磁盘上...

回答 2 投票 1

了解使用Presto / Athena查询ORC时扫描的数据

我在AWS S3的ORC文件中有大量数据。 ORC文件中的数据按uuid排序。我在它们之上创建一个AWS Athena(Presto)表,然后运行以下实验。首先,我检索...

回答 1 投票 1

无法读取Spark中的ORC事务表。看到空的数据框

我们有一个具有ORC文件格式和ZLiB压缩的事务表。这是一个内部表。通过Hive CLI读取时,我可以读取表格。但是当runnnig通过spark sql选择时,它显示...

回答 1 投票 1

通过Spark在Java中存储orc格式

我正在使用spark 1.3.1,并且我希望将数据以蜂巢格式存储为ORC格式。在显示错误的行下,似乎orc并没有作为spark 1.3.1 dataframe.save(“ / apps / hive / ...

回答 1 投票 0

如何将JSON文档转换为Parquet / ORC文件

是否可以将JSON转换为Parquet / ORC格式?我在HIVE 1中的以下步骤中将CSV / TSV数据转换为Parquet:使用TSV数据源和TSV Serde创建外部HIVE表。 2:...

回答 1 投票 0

Hy们,我想要如何在图像中选择文本的帮助

嗨,我想要如何在这样的图像中选择文本的人

回答 1 投票 -3

块和条带之间有什么区别?

摘自Hive的文档:如果表或分区包含许多小的RCFiles或ORC文件,则上述命令会将它们合并为更大的文件。如果是RCFile,则合并发生在块...

回答 1 投票 0

蜂房兽人中varchar的列大小

我在蜂巢中的orc格式有问题。我用不同的格式,默认文本和orc创建2个表。如下所示:CREATE TABLE`test_varchar_1`(`name` varchar(1))ROW FORMAT SERDE'org ....

回答 1 投票 0

Azure数据工厂:使用ORC文件作为ADLS第2代数据流中的源或接收器?

我正在尝试通过一些转换从Avro文件源创建Azure Data Factory数据流,并以ORC文件的形式登陆ADLS gen2。但是,ORC似乎不是数据流的选项...

回答 1 投票 0

ORC文件转储中的条带大小是否以压缩大小格式表示?

[我们已快速生成了压缩的ORC文件。我只是想了解ORC文件转储日志,并且我知道默认情况下ORC的条带大小为64MB。但是,我看到...

回答 1 投票 0

HIVE-ORC读取带有NULL十进制值的问题-java.io.EOFException:读取EOF之后的BigInteger

当在定义为DECIMAL(31,8)的列中加载带有NULL的ORC外部表时,我遇到了有关HIVE的问题。似乎蜂巢加载后无法读取ORC文件,并且...

回答 1 投票 3

如果不使用Map Reduce,Hive 3上的Hive ORC ACID是否需要TEZ?

我的理解是/在Hive 3中,如果未使用针对Hive的Map Reduce或Spark引擎,则使用MERGE的HIVE ORC ACID表也至少需要TEZ作为基础执行引擎。实际上我是...

回答 1 投票 0

Spark:加载或选择ORC格式的Hive表

我正在尝试使用Spark sql加载以ORC格式创建的托管配置单元表。 SparkConf conf =新的SparkConf()。setAppName(ConnectionTest.class.getName())。setMaster(master); JavaSparkContext context = ...

回答 1 投票 3

AZURE Blob存储中的Hive ORC酸表可用于合并

关于HDFS Hive ORC ACID,Hive MERGE没问题。在S3上不可能。对于Azure HD Insight,我无法从文档中明确Azure Blob存储上的此类表是否可行?寻求确认或其他方式。 ...

回答 1 投票 0

使用ORC文件格式将JSON复制到雪花时如何避免键和值标题

根据需要使用CSV文件复制到Snowflake中正在加载JSON列。使用ORC文件加载同一JSON列时,我们会看到标头和其他双引号。当加载csv ...

回答 1 投票 0

在ORC文件中转换Pandas数据框

是否可以在ORC文件中转换熊猫数据框?我可以在镶木地板文件中转换df,但是该库似乎不支持ORC。 Python中是否有可用的解决方案?如果...

回答 1 投票 2

配置单元:合并配置设置不起作用

在Hive 2.2.0上,我使用查询INSERT INTO TABLE TableOrc SELECT * FROM Table;从另一个大小为1.34 GB的源表填充orc表。 ----(1)查询使用6 ...

回答 1 投票 2

是否可以将配置单元表格式转换为ORC并进行存储桶存储

我有一组非ORC格式的配置单元表,也没有存储分区。我想将其格式更改为ORC并进行分类。找不到整个网络的具体答案。 ...

回答 2 投票 0

org.apache.hadoop.hive.ql.io.orc.OrcStruct无法转换为org.apache.hadoop.io.BinaryComparable

在org.apache.hadoop.hive.ql.exec.tez.MapRecordSource.processRow(MapRecordSource.java:83)上的[[org.apache.hadoop.hive.ql.exec.MapOperator.process(MapOperator.java:563) ... 17更多原因...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.