partitioning 相关问题

分区是一种性能策略,您可以将可能非常大的数据组划分为一些较小的数据组。

Oracle 19c。 REF 分区。开始重定义 在4模式下在父表上持有TM锁(当插入数据到中间表时)

在加载重定义的临时表(DBMS_REDEFINITION.START_REDEF_TABLE)的整个过程中,我在临时的父表上有这个TM锁,该表具有到其他会话使用的表的FK...

回答 1 投票 0

使用 METIS 获取连接的分区

我正在 Python 上使用 Metis 来对我拥有的 networkx 图进行分区。我的目标是获得节点权重总和几乎相等的分区,Metis 完美地做到了这一点。然而,一个限制我...

回答 2 投票 0

DBT 合并分区修剪

这是我第一次与dbt合作!我已经使用 #db-bigquery 和以下配置成功实现了增量模型,如下所示 {{ 配置( 物化='增量', 别名='

回答 1 投票 0

如何在 Azure Synapse Notebook Spark 集群 (pyspark) 中安装 Python 库

我在 Azure Synapse Notebook 中安装 Python 库时遇到问题。我尝试使用 %pip... 和 !pip... 安装两个库,“holidays”和“fugue”...我什至尝试过使用 .WHL

回答 1 投票 0

在时间戳发生变化的oracle sql中插入100万条记录

我需要这样的东西 这实际上会在 5-10 分钟内完成...我需要以 1 天的间隔测试使用分区和不使用分区的成本差异 (NUMTODSINTERVAL(1, 'da...

回答 1 投票 0

Azure Synapse SQL Server 分区开关 - 分区完整性

我正在从《Azure 数据工程师助理认证指南》一书中学习分区切换。 我对 GitHub Repo 中的代码示例有疑问。下面是代码。 我的第一个任务...

回答 1 投票 0

跟踪状态更改为特定值的日期

我有一个像这样的表my_table: 编号 |更新于 |地位 ----------------------------------------------------+-------- -----------------------+-----...

回答 1 投票 0

如何在数据仓库中将数据集市拆分成多个部分并在OBIEE中使用来加快数据集市的写入和读取速度?

在我们的数据仓库中,我们有一个巨大的、最常用和最重要的表之一,用于存储帐户数据(他们的 ID、与运营日相对应的 saldo 等)。每天大约...

回答 2 投票 0

Spark:如何将行分组到固定大小的数组中?

我有一个如下所示的数据集: +---+ |col| +---+ |一个| |乙| | c| | d| |电子| | f| |克| +---+ 我想重新格式化这个数据集,以便将行聚合到固定长度的数组中,...

回答 2 投票 0

使用 SELECT 查询从小间隔和聚合值创建更大的 DATETIME 间隔

我在 MySQL 中有一个包含股票数据的表,其中包含以下列: 时间 打开 高的 低的 关闭 体积 我每 5 分钟收到一个条目。如何以每小时而不是 5 分钟的间隔获取这些值

回答 1 投票 0

MySQL 使用 SELECT 查询从小间隔和聚合值创建更大的 DATETIME 间隔

我在 MySQL 中有一个包含股票数据的表,其中包含以下列: 时间 |打开|高|低|关闭 |体积 我每 5 分钟就有一个条目。如何以每小时而不是 5 的间隔获取这些值

回答 1 投票 0

分区表上主键的分区索引

我想创建分区表: 创建表审计 ( id 号(38,0) 不为空启用, 审核时间时间戳(6), ...

回答 2 投票 0

Visual studio 2022 想要安装在此文件路径,但该路径不再可用

D 驱动器不再可用 我无法安装新的 VS。我在 2-3 年前安装了一个装置,从那时起,安装它的驱动器就出现了故障。现在我不能

回答 1 投票 0

根据工作线程、核心和 DataFrame 大小确定 Spark 分区的最佳数量

Spark-land 中有几个相似但不同的概念,围绕如何将工作分配给不同的节点并同时执行。具体来说,有: Spark 驱动程序节点 (

回答 2 投票 0

同时分离分区后删除它是否安全?

我正在尝试在我的 psql(版本 15)数据库上自动进行分区管理。 我想删除旧分区以释放数据库中的一些空间。为此,我计划使用 CONCURRENTLY 关键字将其分离...

回答 1 投票 0

Spark 在读取时是否使用 repartition() 来推断 parquet 文件的分区是否持续存在?

我有两个数据集存储为镶木地板文件,其架构如下: 数据集1: ID 第 1 列 列2 1 v1 v3 2 v2 v4 数据集2: ID 第 3 列 第 4 列 1 v5 v7 2 v6 v8 我想使用 pysp 连接两个数据集...

回答 1 投票 0

如何查询名称由 PL/pgSQL 函数结果构建的表?

我有下面的函数,它接受日期时间并返回整数。 创建或替换函数 public.get_partition_index(带时区的日期时间时间戳) 返回整数 语言 plpgsql 伊穆塔...

回答 1 投票 0

将数组严格分为两部分,其中左半部分元素小于右半部分元素

我需要根据中间值midval将数组A[n]分为两个子数组A1,A2,使得A1(或表示为左边)的所有元素都小于midval,并且所有元素都小于midval元素...

回答 1 投票 0

Athena 分区表未产生任何结果

我正在尝试在 Athena 中创建分区表。在 S3 上,根据指南,我有以下目录结构: aws s3 ls s3://arapbi/polygon/tickers/ PRE dt=...

回答 1 投票 0

将正数列表分配到所需数量的集合中,旨在使它们之间的总和尽可能接近

我发布这篇文章的目的是整合我的其他帖子,其中要求我提供一个最小的工作示例,同时也询问有关代码本身的建议,以防有人提出建议......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.