使用REGEXP从URL的斜线之间提取特定文本

问题描述 投票:2回答:1

我们开始使用Google Data Studio来可视化我们的数据,我们需要REGEX来帮助我们从系统的URL列表中提取特定文本。

URL示例:/ town / articletype / 46646-this-is-an-example-article

我们需要使用REGEX从URL获得的内容:

  • / town /(不加斜杠,并且如果可能的话,将首字母大写)
  • / articletype /(也没有斜线)
  • / 46646-(不带/和-&&这是我们也需要的商品ID)
  • 这是一个示例文章(不带“-”,且首字母大写)

我们尝试了许多REGEX表达式,并通过使用以下公式设法从URL中提取了/ town /:REGEXP_EXTRACT(Page , '/(.*?)(/)')

我们对URL的其他部分没有运气。任何帮助都是极好的。预先感谢!

regex google-data-studio regexp-substr
1个回答
1
投票

下面的4 Calculated Fields可以解决问题:

[1)镇

CONCAT(UPPER(REGEXP_EXTRACT(Page , "^/(\\w{1})")), LOWER(REGEXP_EXTRACT(Page , "^/\\w{1}([^/]*)")))

[2)文章类型

REGEXP_EXTRACT(Page , "^/\\w+/([^/]*)")

3)46646

REGEXP_EXTRACT(Page , "^/\\w+/\\w+/([^-]*)")

4)这是示例文章

CONCAT(UPPER(REGEXP_EXTRACT(Page , "/\\w+/\\w+/\\d+-(\\w{1}).*$")), LOWER(REGEXP_REPLACE(REGEXP_EXTRACT(Page , "/\\w+/\\w+/\\d+-\\w{1}(.*)$"), "-", " ")))

Google Data Studio Report和要详细说明的GIF:

© www.soinside.com 2019 - 2024. All rights reserved.