partitioning 相关问题

分区是一种性能策略,您可以将可能非常大的数据组划分为一些较小的数据组。

Consolidate Prior Identifier from previous Data Load based on Criteria

我有一个定期从第三方 API 中提取的数据管道。例如,对于每日拉取,我会拉取从第一个时间戳(UTC 以 T00:00:00.000Z 结尾)到结束的所有内容

回答 0 投票 0

2000 亿行表的多重查询

我有一个专用的 SQL 池,其中包含 2000 亿行表,该表具有哈希分布且没有数据倾斜。 有多个 CTAS 正在调用一些使用这个 200M 行表的条件...

回答 0 投票 0

是否可以使用 ggraph 创建社区图?

我想在 ggraph 中创建一个社区图。这可能吗? 我使用基本绘图函数和 igraph 制作了它的一个版本。不确定我如何使用 ggraph 执行此操作。

回答 1 投票 0

是否应该在删除之前分离分区?

我正在使用 PostgreSQL 12,其中有一个分区表。该表有需要删除的旧分区。我已经看到了旧分区首先分离的代码,然后才分离

回答 2 投票 0

Spark分区与并行的关系

我不明白你说的spark分区越多,并行度越高是什么意思。 一个核心(任务)处理一个分区,这意味着它是并行的...

回答 1 投票 0

如何恢复已删除的跨区卷分区

我正在设置一个新的硬盘驱动器并试图将它添加到一个跨区卷中,但在这样做时不小心删除了分区,该分区跨越了 3 个驱动器并且上面有超过 4 TB 的数据......

回答 0 投票 0

USB 驱动器损坏或隐藏分区 [关闭]

最近买了一个金士顿U盘,下载了一个ISO镜像,做了一个开机加载U盘。当时我的系统是 Ubuntu 22.04。 之后,我使用

回答 0 投票 0

如何在 Cassandra 中实现自定义分区逻辑?

我是 Cassandra 的新手,我正在构建一个聊天应用程序。假设我必须将聊天消息存储在数据库中,我希望使用 Cassandra,因为它允许快速写入。我的“我......”的数据模型

回答 0 投票 0

获取表分区的详细信息,包括开始日期

我有这个表 employees,它有 3 个基于字符串列的分区,我必须使用查询来获取这些分区的详细信息,目前我能够获得该表上的分区,即“北...

回答 0 投票 0

使用分区(postgres)连接大表的最佳实践?

我正在对两个巨大的客户资料表进行身份解析。我想加入他们的客户姓氏,以及我已经准备好的昵称变体的名字: 选择...

回答 0 投票 0

显示用户名和邮箱,有效投标总数,投标项目总数

我正在尝试弄清楚如何获取用户出价的项目总数以及有效出价的总数(bid_status = 'ok),但是我使用的每个代码都得到相同的数字上校...

回答 0 投票 0

Spark:如何为每个唯一的表达式值获取分区?

我创建了名为 bucket 的技术专栏,并将其用于重新分区我的 DataFrame。但是我得到的分区数量比我拥有的 partitionExpr 的唯一值要少。 有没有办法让Spark变成

回答 0 投票 0

拆分 60 亿条记录的表的最佳选择是什么?

我们在包含 60 亿条记录的 HANA 数据库上有表。此表中的 PK 是 5 列类型为 varchar(30)。我们想把这组 60 亿条记录分成最多 5000 万条

回答 3 投票 0

移动 EFI 系统分区 [关闭]

我有一个 512 GB SSD,安装了 Windows 10 操作系统,分区 (GPT) 如下: 事实证明系统分区命中 ESP 使我无法扩展它。 我可以解决这个问题吗...

回答 0 投票 0

尽管没有合并/重新分区,为什么 spark 只创建一个零件文件?

我只有 dataset.write().format("parquet").save("path"); 不,COALESCE/PARTITION 在源代码的任何地方。 具有 4 个执行器的远程集群 情况1: 输入大小:500 MB (1 M...

回答 1 投票 0

如何在 mysql 8 中按年对表进行分区,然后按月进行子分区

我有一个包含月份和年份列的表。 我有一个查询,通常看起来像 WHERE month=1 AND year=2022 鉴于这张桌子有多大,我想让它更有效......

回答 2 投票 0

Logsink到bigquery分区不工作

我在文件夹级别上创建了一个logsink,所以它整齐地将所有的日志流到Bigquery。在日志汇配置中,我指定了以下选项,让日志汇流到(每日)分区。"...

回答 1 投票 0

如何在以下行的范围内查找最大值 - SQL Teradata

我有一个表,有以下栏目:账户,有效期_日期,有效期_月份,金额。对于每一行,我想找到下个月的最大(金额)。 帐户有效期_日期有效期_月份...

回答 1 投票 0

合并、分区和远程数据库 - Oracle性能调整

我想调整我的合并查询,它基于SQL Server中的源表在Oracle中插入和更新表。表的大小约为1.2亿行,通常约有12万条记录被插入updated......我想调整我的合并查询,该查询基于SQL Server中的源表在Oracle中进行更新。

回答 1 投票 1

Exchange Partition 给出 -Table 或 index is not partitioned. 无效的语法

我有两个模式TBCAM和AR_TBCAM。在TBCAM中有一张表叫BKP_COST_EVENT,我已经对它进行了分区,并将分区数据移到了AR_TBCAM模式中的另一张简单表中,名为......。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.