我正在使用名为“产品”的字段进行工作,每个产品都有产品名称和颜色。例如“蓝蓝车”或“野黄野黄球”。我的问题是我需要在第二个实例中删除重复的单词。所以我想使用正则表达式将上面的内容变成“Blue Car”和“Wild Yellow Ball”,有人可以帮助我吗?
我试过这个:
REGEXP_REPLACE([Product], "(\b\w+\b)(?=\s+\b\1\b)", "")
但它只会在它们彼此相邻时删除重复项,因此“蓝色蓝色汽车”被固定为“蓝色汽车”,但它不会修复“野生黄色野生黄色球”,因为它们彼此不相邻
可以这样做
((?:\b\w+(?:\s+\w+)*\b))\s+\1\b
替换为捕获组 1
( # (1 start)
(?:
\b \w+
(?: \s+ \w+ )*
\b
)
) # (1 end)
\s+
\1 \b