如何删除重复值的谷歌数据工作室

Question

我有一个维度(google sheets中的一列)叫产品，其值如下。

product = [apple , apple_old_2019, pineapple , pineapple_old_2020, pineapple_old_2017 ...]

我需要重新搜索，然后删除模式： old_**** 然后按名称汇总这些值。

在Google Sheets中，我会替换这些值，然后使用Unique公式，但在Google Data Studio中没有这样的功能。

我用这个公式创建了一个名为Product_pre的自定义字段。

REGEXP_EXTRACT(Product , '^(.+?)(_old_[0-9]{2}-[0-9]{4})' )

然后我又用下面的公式创建了一个自定义字段。

CASE
    WHEN Product_pre_process is null THEN Product
    ELSE Product_pre_process 
END

问题是，结果有重复的值。

product_processed = [apple , apple, pineapple , pineapple, pineapple ...]

我怎样才能解决这个问题？

Answer 1

1) 提取第一个词 该 REGEXP_EXTRACT 下面的函数可以做到这一点（从每个字符串的开头提取所有的字符，直到第一个实例的 _):

REGEXP_EXTRACT(Product , "^([^_]*)")

(2) 巩固 如果图表类型是表然后删除其余的维度，只留下新创建的维度，将导致度量值基于维度中的两个值自动聚合 (apple 和 pineapple).

谷歌数据工作室报告以及一个GIF来直观地展示上述内容。