window-functions 相关问题

窗口函数是一种SQL操作,它聚合在结果集的分区上。

在ROW_NUMBER()中包含行,其中大于1的行包括第一个值

我需要找到具有相同名称,姓氏和出生日期的用户。我必须包括每个人的客户端ID,所以我不能使用COUNT(*)和group by。我正在使用ROW_NUMBER()分区...

回答 1 投票 1

如何将结果的数量限制为每个'用户'只有5个,但如果第5行的立即值与连续行相同,则允许更多行?

我有一个包含Domain_id,工资和工资日期的数据库。我的问题是我必须找到每个域5个最高的工资,但是行数(5行)可以增加到更多,如果......

回答 1 投票 1

优化sum()over(order by ...)子句抛出'资源超出'错误

我正在从BigQuery的out网站的事件数据中计算会话表。事件表有大约1200万个事件(非常小)。在我添加逻辑来创建会话后,我想总结...

回答 1 投票 0

count(distinct)over(partition by ...在Oracle SQL中不起作用

我想计算过去30天的不同day_number。但是,不能使用distinct函数如果我删除distinct,它会给我day_number的总数,但是......

回答 2 投票 0

在impala中ROW_NUMBER()OVER

我有一个用例,我需要在PARTITION上使用ROW_NUMBER():类似于:SELECT Column1,Column 2 ROW_NUMBER()OVER(按FREQ,MAN,MODEL分类的ACCOUNT_NUM分区)为......

回答 4 投票 5

我在select查询中有一个select查询,它抛出错误:“用作表达式的子查询返回的多行”[duplicate]

我正在尝试显示多个内容,例如userid,salary等。我使用select语句来执行此操作。在这个select语句中,我需要使用另一个select语句来提供'分数...

回答 1 投票 0

加入两个查询会返回比预期更多的行?

我有两个问题。它们都返回大约60行。但加入后,它们会返回900行。有没有办法在加入时获得60行。查询1:SELECT f.id_user,f ....

回答 1 投票 -1

pyspark:使用时间序列数据滚动平均值

我有一个由时间戳列和美元列组成的数据集。我想找到每行的平均美元数,在每行的时间戳结束。我最初看的是......

回答 4 投票 13

应用Window函数计算pySpark中的差异

我正在使用pySpark,并设置了我的数据框,其中两列代表每日资产价格,如下所示:ind = sc.parallelize(range(1,5))prices = sc.parallelize([33.3,31.1,51.2,21.3] )data = ...

回答 2 投票 15

计算列上的窗函数

我正在写一个看起来像这样的查询:select parent.id,parent.date,sum(child.amount)filter(where child.is_ok)as child_sum,sum(sum(child.amount)filter(...

回答 1 投票 1

如何编写查询以获得此类输出?

我希望Pdate列作为输出。我有这三个属性:id,Bonus和Date。我必须获得日期列的输出,以便该列显示员工收到20或......时的先前日期

回答 1 投票 0

如何将多个子查询作为单个子查询加入而不使用“with”?

我有一个由多个子查询组成的查询。我使用'join'作为我不允许使用'with'。子查询具有“from”子句,这会产生问题。我必须每个显示两列...

回答 2 投票 -2

从行窗口获取最大值作为所有行的新列

| col 1 | col 2 | col 3 | | ------- | ------- | ------- | | 67458 | ADM | 1008 | | 67458 | ADM | 1009 | | 67458 | SKI | 1009 | | 67458 | LIS | 1010 | | 67458 | TOU | 1121 |如何获得最大...

回答 4 投票 1

ROW_NUMBER(),PARTITION_BY,TOP 2 MAX如果MAX第一位和最后一位

我有一个使用ROW_NUMBER()和PARTITION BY的查询以及基于日期col的订单。我想知道的是,如果可以限制这个并且仅返回匹配的col1,如果第二个...

回答 1 投票 -1

分区行,其中日期位于先前日期之间

我有下表。我想确定start_date和end_date的重叠间隔。 *编辑我想删除开始日期和结束日期之间天数最少的行...

回答 2 投票 0

优雅的方法从每个组中获取第一个值而不使用外部查询

我试图从我的数据中的每个组中获取第一个值。但是我不喜欢使用外部查询/ with子句。你能告诉我怎样才能以优雅的方式写出来......

回答 1 投票 0

Spark:在spark数据帧上是否存在agg函数和窗口函数之间的差异?

我想在spark Dataframe(Spark 2.1)中的列上应用一个总和,我有两种方法可以做到这一点:1-使用Window函数:val windowing = Window.partitionBy(“id”)dataframe .withColumn(“sum” ,sum(col(...)

回答 1 投票 0

Redshift的月号保留群组计算问题

我试图在过去9个月内按月计算红移中的用户保留队列。但是我遇到了一个问题,即下面的查询中的月份队列没有被正确归入...

回答 1 投票 0

使用具有前导null的SQL窗口函数计算移动平均值,其中没有足够的数据可用

我想使用SQL窗口函数计算移动平均值。以下2“日”移动平均线的示例基本上可以正常工作,但如果只有一个数据点,它也会计算平均值...

回答 4 投票 4

总和直到达到阈值,然后重置计数器

user_id |日期|距离1 | 2019-04-09 00:00:00 | 2 1 | 2019-04-09 00:00:30 | 5 1 | 2019-04-09 00:01:00 | 3 1 | 2019-04-09 00:01:45 | 7 1 | 2019-04 -...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.