presto 相关问题

Presto是一个开源的分布式SQL查询引擎,用于针对各种大小(从千兆字节到千兆字节)的数据源运行分析查询。

如何将时间列分为5秒间隔并使用Presto计算行数?

我正在使用Presto和Zeppelin。有很多原始数据。我必须总结那些数据。我想每5秒组一次。 serviceType logType date -------------------------------- ...

回答 1 投票 1

是否可以使用S3的自定义凭据提供程序从Presto中的线程上下文中检索用户?

为了让Presto访问S3上的数据,我需要能够为不同的用户承担不同的角色(前Bob - > role1和Brenda - > role2)。我知道EMRFS提供了这个功能但是我们正在移动......

回答 1 投票 0

Presto SQL - 尝试将多列中的数据拉入一个条目以查找唯一,缺失或欺骗条目

这里是SQL / Presto的新手。如果需要,请随意指出明显的。我有一个子查询,将数据拉入如下表格。对于每个ItemID,1表示标签打开,0表示关闭。我是 ...

回答 1 投票 0

显示Presto中所有模式的表

在Presto SHOW SCHEMAS;返回所有模式SHOW TABLES FROM foo;返回foo模式的所有表是否有一种简单的方法从Presto中的所有模式返回表?

回答 1 投票 2

什么可以使这两个查询返回不同的结果?

我在Amazon Athena上有一个ELB日志表,我正在尝试通过url请求每日请求。该表是结构是这里描述的,但我也添加了日,月和年的分区...

回答 1 投票 0

AWS Athena - 如何更改日期字符串的格式

我在AWS Athena的数据库中有两个表,我想加入。我希望通过几个专栏加入他们,其中一个是日期。但是在一个数据集中,日期字符串被编码为单个...

回答 1 投票 1

用于从特定组[符号]中删除特定行[时间]的SQL语法

我遇到了SQL查询知识的边缘,可以使用正确方向的一个点。 (我使用的是Presto,但理想情况下这应该无关紧要,因为Presto使用常见的SQL语法。)...

回答 2 投票 1

Presto中的模内组等效

在Postgres中,以下查询为每个客户输出最常购买的奶酪:SELECT customer,MODE()WITHIN GROUP(ORDER BY“subcategory”)AS“fav_cheese”FROM dft WHERE ...

回答 1 投票 0

AWS Athena SYNTAX_ERROR:不是有效的时间戳文字

我正在尝试运行以下查询:SELECT startDate FROM tests WHERE startDate BETWEEN TIMESTAMP'1555248497'ENTERESTAMP''1555248498'limit 10;并不断收到此错误消息:...

回答 1 投票 2

Hue无法加载Presto Schema dbc不存在

我刚刚构建了Hue-4.1.0,它能够通过jdbc执行Presto sql。这是我的hue-presto配置:[notebook] [[interpreters]] [[[presto-jdbc]]] name = Presto-jdbc interface = jdbc ...

回答 1 投票 0

有没有办法在列前将列除以列总数?

我在presto中设置了一个查询。我有两列 - 一个是类别,另一个是数字。我想按照它的总数来设置数字列,同时将不同的类别分组...

回答 1 投票 0

在VM群集上安装Presto并将其连接到不同Yarn群集上的HDFS

我们有一个HDP 2.6.4火花群集,有10个linux工作机器。群集通过HDFS运行spark应用程序。 HDFS安装在所有工作人员上。我们希望安装presto,它将查询...

回答 1 投票 3

考虑到AWS Athena中的Windows事件管理器事件时间戳,如何使用SQL测试5分钟的时间间隔

我在AWS中使用Athena和Windows事件管理器日志来构建一些安全事件查询。其中之一是我想查询报告3次或更多次失败登录尝试的机器...

回答 2 投票 0

SQL COUNT(DISTINCT(field1))GROUP BY MAX(已提交2)

我有一个像名字这样的表num_try John 2 John 1 Mike 3 Mike 2 Linda 2我想知道按MAX(num_try)计算不同的名字组。期望的结果应该看起来像MAX(num_try)......

回答 1 投票 2

Presto每行最小

我在PrestoDB中有一个4列类型为timestamp tz的表 - 没有NULL值 - 并且无法获得每行的最小值。它似乎反直觉,因为:SELECT(SELECT MIN(Col)FROM(VALUES ......)

回答 1 投票 -1

避免使用格式时间无效的SQL用户

这是我的简单查询SELECT playerId,max(accountlevel)as level,max(appActiveTime)as overall_time,max(matchcount)as matchcount FROM client WHERE partition_0 ='2019'AND partition_1 ='03'...

回答 1 投票 -2

来自ST_GeometryFromText(x)的WKT无效

我正在尝试使用presto函数ST_GeometryFromText将varchar WKT格式转换为几何,但是我收到此错误运行查询时出错:WKT无效:...

回答 1 投票 0

SQL - 选择日期范围内的行?

我正在尝试选择日期范围内的所有行,包括开始日和结束日 - 例如,从表中选择*,其中2019-03-01和2019-03-08之间的时间戳我想要所有行...

回答 1 投票 0

具有来自每行的不同表的值的列

我有一个相当复杂的问题,我甚至不确定可以单独使用presto / sql;所以我很感激任何意见。设置。我有一个订单表...(table1)order_id | customer_id | ...

回答 2 投票 0

如何将presto集群集成到hadoop集群?

我们有基于ambari的Hadoop集群由于thrift服务器性能不佳,我们决定用presto替换它我们当前的Hadoop集群有以下机器960数据节点机器(...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.