我的网站列表很长,需要某种方式来识别是否有重复的网站。
例如:
Google表格是否有某种形式的添加项或公式来检测此列表是否具有重复项? (有2个INC页面,因此是一对重复项,而2个《福布斯》页面则是另一对重复项)
用途:
=ARRAYFORMULA(IF(COUNTIF(IFERROR(IFNA(REGEXEXTRACT(INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1),
"\.(.+\..+)"), INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1))),
IFERROR(IFNA(REGEXEXTRACT(INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1),
"\.(.+\..+)"), INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1))))>1,
"Duplicate", ))