window-functions 相关问题

窗口函数是一种SQL操作,它聚合在结果集的分区上。

在elasticsearch中对postgresql的分区进行排名

我们面临着将大型数据集迁移到postgres(备份或其他)的弹性搜索中的问题。我们有类似这样的架构+ --------------- + -------------- + ------------ + ----------...

回答 3 投票 3

Postgres:对于每一行,在条件下评估所有连续的行

我有这个表:id | datetime | row_number 1 2018-04-09 06:27:00 1 1 2018-04-09 14:15:00 2 1 2018-04-09 15:25:00 3 1 2018-04-09 15:35:00 4 1 2018-04-09 15:51:...

回答 1 投票 0

为什么这个窗口表达式不会导致除零错误?

我在编程拼图和代码高尔夫上遇到了这个答案。在其中,作者使用表达式(虽然答案已被编辑以使用不同的解决方案):r ow_number()over(order ...

回答 4 投票 9

如何将时间戳分组到岛屿(基于任意间隙)?

将此日期列表视为时间戳:我使用颜色手动对日期进行分组:每个组与下一个组分开至少2分钟的间隔。我想测量给定的...

回答 2 投票 1

按多个表达式分区

参考ROW_NUMBER窗口函数的语法后面提到了关于PARTITION BY: - PARTITION BY expr_list可选。一个或多个定义ROW_NUMBER函数的表达式。我是 ...

回答 2 投票 0

PostgreSQL:区间'10天'和当前行之间的范围

我有一张桌子,可以为每件商品存储每日价格。如果价格尚未更新,则该日期没有该项目的记录。我需要编写一个查询,为每个项目检索...

回答 2 投票 1

Informix窗口函数范围子句的行为类似于rows子句

在Informix中考虑这个陈述:SELECT a,b,sum(a)over(order by b)“no frame”,sum(a)over(b by bb between unbounded previous and current row)“range”,sum(a超过(...

回答 2 投票 3

在规范化大型PySpark数据帧时,CodeGen增长超过64 KB

我有一个包含1300万行和800列的PySpark数据帧。我需要对这些数据进行规范化,因此一直使用此代码,该代码适用于较小的开发数据集。 def z_score_w(col,w):...

回答 2 投票 5

根据评论数量为电影分配排名 - Django

我有电影,每部电影都添加了评论。我想创建一个函数,根据使用密集排名的大量评论对我的电影进行排名。这是我到目前为止 - 问题是,...

回答 1 投票 0

排名函数oracle sql

我是sql的新手,正在完成任务。有一个问题,我应该使用rank函数,但我不知道如何使用它。我试图在互联网上找到一些信息,但......

回答 2 投票 0

如何用PostgreSQL中的前一个值填充Null?

我有一个包含Null值的表。我需要用之前的非Null值替换它们。这是我拥有的数据示例:date |类别| start_period | period_number | ------...

回答 2 投票 0

在OVER中使用CTE(PARTITION BY)

我正在尝试从表中的3列计算数量,并仅返回唯一的卷。我们有很多行具有相同的宽度,高度和长度,因此我的体积计算自然会...

回答 3 投票 1

在T-SQL中分区PIVOT表

我喜欢窗口函数,因此我使用简单的row_number()函数根据employeeID拆分一些数据。我写的,有效,但我不禁想到它......

回答 2 投票 1

SQL Server - ROW_NUMBER() - >再次重置?

我们正在编写一个查询中遇到的特定问题。这是一个例子:Doc。 ID |时间戳|员工01 | 01 | A 01 | 02 | B 01 | 03 ...

回答 2 投票 0

我可以在学说2中使用窗口函数吗?

SELECT invoice.id,COUNT(slip.id),SUM(projected_minutes)OVER(PARTITION BY task.id)AS projected_minutes FROM invoice INNER JOIN任务ON task.invoice_id = invoice.id LEFT JOIN slip ON slip.task_id ...

回答 3 投票 5

检测SQL中时间序列数据中超出阈值的值更改

在PostgreSQL中,我试图找到一系列值低于60的主题,然后是两个超过60的连续值。我也对...之间的时间长度感兴趣

回答 1 投票 1

如何将可重复分区作为一个又一个新分区?

OVER子句中的“Partition by”将所有值组合为唯一,就像“Distinct”或“Group by”一样。这是它在我的查询中使用row_number()的方式:id st t row_number --------------...

回答 1 投票 0

Django - 使用与该事件的开始DateTime重叠的参与者总和来注释每个事件

我有一个具有开始DateTime和结束日期时间的事件模型,以及参与者的数量。对于每个Event对象,我希望在任何事件中获得所有参与者的注释Sum ...

回答 1 投票 1

t-sql函数类似于“filter”,用于sum(x)filter(condition)over(partition by

我正在尝试用过滤器对窗口求和。我看到类似于sum(x)filter(condition)over(partition by ...)的东西,但它似乎在t-sql,SQL Server 2017中不起作用。基本上,我想...

回答 1 投票 0

在窗口(Scala)上标识列的重复值

我有一个包含两列的数据框:“ID”和“Amount”,每行代表一个特定ID的交易和交易金额。我的例子使用以下DF:val df = sc.parallelize(...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.