PostgreSQL unnest() 与元素编号

Question

当我有一列包含分隔值时，我可以使用

unnest()

函数：

myTable
id | elements
---+------------
1  |ab,cd,efg,hi
2  |jk,lm,no,pq
3  |rstuv,wxyz

select id, unnest(string_to_array(elements, ',')) AS elem
from myTable

id | elem
---+-----
1  | ab
1  | cd
1  | efg
1  | hi
2  | jk
...

如何包含元素编号？即：

id | elem | nr
---+------+---
1  | ab   | 1
1  | cd   | 2
1  | efg  | 3
1  | hi   | 4
2  | jk   | 1
...

我想要源字符串中每个元素的原始位置。我尝试过使用窗口函数（

row_number()

、

rank()

等），但我总是得到

。也许是因为它们位于源表的同一行？

我知道这是一个糟糕的桌子设计。这不是我的，我只是想修复它。

Answer 1

Postgres 14 或更高版本

使用

string_to_table()

而不是

unnest(string_to_array())

作为逗号分隔的字符串：

选择 t.id、a.elem、a.nr
来自 tbl t
左连接横向 string_to_table(t.elements, ',')
                    有序性 AS a(elem, nr) ON true;

小提琴

Postgres 9.4 或更高版本

使用

WITH ORDINALITY

实现设置返回函数：

当
FROM
子句中的函数带有
WITH ORDINALITY
后缀时，
bigint
列附加到从 1 开始的输出，函数输出的每一行加 1。这是最对于设置返回函数（例如
unnest()
）很有用。

结合pg 9.3+中的

LATERAL功能，并根据pgsql-hackers上的这个线程，上面的查询现在可以写成：

选择 t.id、a.elem、a.nr
来自 tbl AS t
左连接横向 unnest(string_to_array(t.elements, ','))
                    有序性 AS a(elem, nr) ON true;

LEFT JOIN ... ON true

保留左表中的所有行，即使右侧的表表达式不返回任何行。参见：

PostgreSQL 中的 LATERAL JOIN 和子查询有什么区别？

如果不关心这个问题，您可以使用其他等效的、less verbose 形式，并带有隐式

CROSS JOIN LATERAL

:

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);

或更简单，基于实际数组（

arr

是数组列）：

SELECT t.id, a.elem, a.nr
FROM   tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);

或者只使用默认列名称：

SELECT id, a, ordinality
FROM   tbl, unnest(arr) WITH ORDINALITY a;

或更短，但是：

SELECT id, a.* FROM tbl, unnest(arr) WITH ORDINALITY a;

或最小语法：

SELECT * FROM tbl, unnest(arr) WITH ORDINALITY a;

当然，最后一个返回

tbl

的所有列。

自动成为表和列别名（对于第一列）。添加的序数列的默认名称为

ordinality

。但添加显式列别名和表限定列会更清晰。

以这种方式保留数组元素的原始顺序。

unnest()

的手册：

将数组扩展为一组行。数组的元素按存储顺序读出。

Postgres 8.4 - 9.3

使用

row_number() OVER (PARTITION BY id ORDER BY elem)

，您可以根据排序顺序获得数字，而不是字符串中原始序数位置的序数。

您可以简单地省略

ORDER BY

:

SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM  (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;

虽然这通常有效并且我从未见过它在简单查询中失败，但 PostgreSQL 对于没有

ORDER BY

的行顺序没有任何断言。由于实现细节，它恰好可以工作。

要保证空格分隔的字符串中元素的序数：

SELECT id, arr[nr] AS elem, nr
FROM  (
   SELECT *, generate_subscripts(arr, 1) AS nr
   FROM  (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
   ) sub;

或更简单，如果基于实际数组：

选择 id, arr[nr] AS elem, nr
FROM (SELECT *,generate_subscripts(arr, 1) AS nr FROM tbl) t;

dba.SE上的相关答案：

如何保留未嵌套数组中元素的原始顺序？

Postgres 8.1 - 8.4

这些功能尚不可用：

RETURNS TABLE

、

generate_subscripts()

、

unnest()

、

array_length()

。但这有效：

CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

特别注意，数组索引可以与元素的顺序位置不同。考虑这个具有扩展功能的演示：

CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
  RETURNS SETOF record
  LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
 FROM   generate_series(array_lower($1,1), array_upper($1,1)) i';

SELECT id, arr, (rec).*
FROM  (
   SELECT *, f_unnest_ord_idx(arr) AS rec
   FROM  (
      VALUES
        (1, '{a,b,c}'::text[])  --  short for: '[1:3]={a,b,c}'
      , (2, '[5:7]={a,b,c}')
      , (3, '[-9:-7]={a,b,c}')
      ) t(id, arr)
   ) sub;

 id |       arr       | val | ordinality | idx
----+-----------------+-----+------------+-----
  1 | {a,b,c}         | a   |          1 |   1
  1 | {a,b,c}         | b   |          2 |   2
  1 | {a,b,c}         | c   |          3 |   3
  2 | [5:7]={a,b,c}   | a   |          1 |   5
  2 | [5:7]={a,b,c}   | b   |          2 |   6
  2 | [5:7]={a,b,c}   | c   |          3 |   7
  3 | [-9:-7]={a,b,c} | a   |          1 |  -9
  3 | [-9:-7]={a,b,c} | b   |          2 |  -8
  3 | [-9:-7]={a,b,c} | c   |          3 |  -7

比较：

标准化数组下标，使其以 1 开头

Answer 2

尝试：

select v.*, row_number() over (partition by id order by elem) rn from
(select
    id,
    unnest(string_to_array(elements, ',')) AS elem
 from myTable) v

Answer 3

使用下标生成函数。
http://www.postgresql.org/docs/current/static/functions-srf.html#FUNCTIONS-SRF-SUBSCRIPTS

例如：

SELECT 
  id
  , elements[i] AS elem
  , i AS nr
FROM
  ( SELECT 
      id
      , elements
      , generate_subscripts(elements, 1) AS i
    FROM
      ( SELECT
          id
          , string_to_array(elements, ',') AS elements
        FROM
          myTable
      ) AS foo
  ) bar
;

更简单地说：

SELECT
  id
  , unnest(elements) AS elem
  , generate_subscripts(elements, 1) AS nr
FROM
  ( SELECT
      id
      , string_to_array(elements, ',') AS elements
    FROM
      myTable
  ) AS foo
;

Answer 4

如果元素的顺序不重要，你可以

select 
  id, elem, row_number() over (partition by id) as nr
from (
  select
      id,
      unnest(string_to_array(elements, ',')) AS elem
  from myTable
) a

Answer 5

我认为这是相关的，使用相关子查询将任意排名/序数值分配给最终集合。它更多的是使用 PG 数组处理来 De-Pivot 数据集的实际应用（适用于 PG 9.4）。

WITH _students AS ( /** CTE **/
                  SELECT * FROM
                    (   SELECT 'jane'::TEXT ,'doe'::TEXT , 1::INT 
                         UNION
                        SELECT 'john'::TEXT ,'doe'::TEXT , 2::INT 
                         UNION
                        SELECT 'jerry'::TEXT ,'roe'::TEXT , 3::INT 
                         UNION
                        SELECT 'jodi'::TEXT ,'roe'::TEXT , 4::INT 
                    ) s ( fn, ln, id )
) /** end WITH **/   
SELECT s.id
 , ax.fanm
 , ax.anm
 , ax.val
 , ax.num
FROM _students s
,UNNEST /** MULTI-UNNEST() BLOCK **/
    (
        ( SELECT ARRAY[ fn, ln ]::text[] AS anm 
                  /** CORRELATED SUBQUERY **/
                 FROM _students s2 WHERE s2.id = s.id 
         )   
   
        ,( SELECT ARRAY[ 'first name', 'last name' ]::text[] AS fanm )  
     
        ,( SELECT ARRAY[ '9','8','7'] AS val) 
   
        ,( SELECT ARRAY[ 1,2,3,4,5   ] AS num) 
        
   ) ax (  anm, fanm, val, num )
;

去旋转结果集：

+--+----------+-----+----+---+
|id|fanm      |anm  |val |num|
+--+----------+-----+----+---+
|2 |first name|john |9   |1  |
|2 |last name |doe  |8   |2  |
|2 |NULL      |NULL |7   |3  |
|2 |NULL      |NULL |NULL|4  |
|2 |NULL      |NULL |NULL|5  |
|1 |first name|jane |9   |1  |
|1 |last name |doe  |8   |2  |
|1 |NULL      |NULL |7   |3  |
|1 |NULL      |NULL |NULL|4  |
|1 |NULL      |NULL |NULL|5  |
|4 |first name|jodi |9   |1  |
|4 |last name |roe  |8   |2  |
|4 |NULL      |NULL |7   |3  |
|4 |NULL      |NULL |NULL|4  |
|4 |NULL      |NULL |NULL|5  |
|3 |first name|jerry|9   |1  |
|3 |last name |roe  |8   |2  |
|3 |NULL      |NULL |7   |3  |
|3 |NULL      |NULL |NULL|4  |
|3 |NULL      |NULL |NULL|5  |
+--+----------+-----+----+---+

Answer 6

unnest2()

作为练习

pg v8.4 之前的旧版本需要用户定义的

unnest()

。我们可以修改这个旧函数以返回带有索引的元素：

CREATE FUNCTION unnest2(anyarray)
  RETURNS setof record  AS
$BODY$
  SELECT $1[i], i
  FROM   generate_series(array_lower($1,1),
                         array_upper($1,1)) i;
$BODY$ LANGUAGE sql IMMUTABLE;

PostgreSQL unnest() 与元素编号

问题描述投票：0回答：6

6个回答

Postgres 14 或更高版本

Postgres 9.4 或更高版本

Postgres 8.4 - 9.3

Postgres 8.1 - 8.4

`unnest2()`
作为练习

最新问题

PostgreSQL unnest() 与元素编号

问题描述 投票：0回答：6

6个回答

Postgres 14 或更高版本

Postgres 9.4 或更高版本

Postgres 8.4 - 9.3

Postgres 8.1 - 8.4

unnest2()作为练习

最新问题

问题描述投票：0回答：6

`unnest2()`
作为练习