我有一个Hive表,如下
CustID item_val
10 sb1|sb2
11 sb2|sb3
12 sb1|sb4
13 sb2|sb3|sb5
14 None
15 sb1
我需要在 item_val 列中拆分并获取每个项目的计数值。
预期产出
Item count
sb1 3
sb2 2
sb3 2
sb4 1
sb5 1
None 1
我累了下面的计数,但值没有得到正确的分界。
SELECT msg, count(*) FROM (SELECT distinct split(item_val,'\\|') AS msg FROM hive_table) t GROUP BY msg;
请帮助