序列化配置单元映射列

问题描述 投票:2回答:1

是否有任何自定义udf或其他函数可用于对配置单元映射字段进行序列化,以便可以在group by和join条件中使用它。

例如,我们有一个地图字段:

dim_map = {'dim_geo': 'San Francisco', 'dim_country': 'USA'}

由于要在此字段上连接两个表。

hive hiveql
1个回答
1
投票

使用brickhouse udf将其转换为JSON字符串,下载源代码,进行编译,添加jar文件并创建函数,请参见Getting Started说明:

add jar /path/brickhouse-0.7.0-SNAPSHOT.jar;  
CREATE TEMPORARY FUNCTION to_json AS 'brickhouse.udf.json.ToJsonUDF';

select to_json(dim_map) as dim_map_json
  from...
© www.soinside.com 2019 - 2024. All rights reserved.