我有一个维度(google sheets中的一列)叫产品,其值如下。
product = [apple , apple_old_2019, pineapple , pineapple_old_2020, pineapple_old_2017 ...]
我需要重新搜索,然后删除模式: old_****
然后按名称汇总这些值。
在Google Sheets中,我会替换这些值,然后使用Unique公式,但在Google Data Studio中没有这样的功能。
我用这个公式创建了一个名为Product_pre的自定义字段。
REGEXP_EXTRACT(Product , '^(.+?)(_old_[0-9]{2}-[0-9]{4})' )
然后我又用下面的公式创建了一个自定义字段。
CASE
WHEN Product_pre_process is null THEN Product
ELSE Product_pre_process
END
问题是,结果有重复的值。
product_processed = [apple , apple, pineapple , pineapple, pineapple ...]
我怎样才能解决这个问题?
1) 提取第一个词 该 REGEXP_EXTRACT
下面的函数可以做到这一点(从每个字符串的开头提取所有的字符,直到第一个实例的 _
):
REGEXP_EXTRACT(Product , "^([^_]*)")
(2) 巩固 如果图表类型是 表然后删除其余的维度,只留下新创建的维度,将导致度量值基于维度中的两个值自动聚合 (apple
和 pineapple
).
谷歌数据工作室报告 以及一个GIF来直观地展示上述内容。