Robots.txt 中没有索引

问题描述 投票:0回答:3

我有一个 WordPress 网站,已在搜索引擎中编入索引。

我已编辑 Robots.txt 以禁止搜索索引中的某些目录和网页。

我只知道如何使用allow和disallow,但不知道如何使用Robots.txt文件中的follow和nofollow。

我在谷歌搜索时在某处读到,我可以拥有不会在谷歌中索引但会被抓取以获得页面排名的网页。这可以通过禁止 Robots.txt 中的网页并对网页使用 follow 来实现。

请告诉我如何在 Robots.txt 文件中使用 follow 和 nofollow。

seo search-engine robots.txt nofollow
3个回答
1
投票

a.) 关注/不关注和索引/不索引规则不适用于 robots.txt(设置一般站点规则),而是用于页面元机器人标签(设置此特定页面的规则)

有关元机器人的更多信息

b.) Google 不会抓取禁止的页面,但它可以在 SERP 上对它们进行索引(使用来自入站链接或 Dmoz 等网站目录的信息)。
话虽如此,你并不能从中获得任何公关价值。

有关 Googlebot 索引行为的更多信息


1
投票

Google 实际上确实识别 robots.txt 中的 Noindex: 指令。 Matt Cutts 对此进行了谈论:http://www.mattcutts.com/blog/google-noindex-behavior/

如果您在 robots.txt 中为 Google 索引中已存在的页面添加“禁止”,您通常会发现该页面像幽灵一样保留在索引中,但被剥夺了关键字。我想这是因为他们知道他们不会抓取它,并且他们不希望索引包含位腐烂。因此,他们将页面描述替换为“由于此网站的 robots.txt,无法提供此结果的描述 - 了解更多。”

所以,问题仍然存在:既然“禁止”不起作用,我们如何从 Google 中删除该链接?通常,您希望在相关页面上使用元机器人 noindex,因为如果 Google 看到此更新,实际上会从索引中删除该页面,但使用您的 robots 文件中的 Disallow 指令,他们将永远不会知道这一点。

因此,您可以从 robots.txt 中删除该页面的禁止规则,并将元机器人 noindex 标记添加到页面的标题中,但现在您必须等待 Google 返回并查看您告诉他们忘记的页面。

您可以从主页创建一个指向它的新链接,希望 Google 能够得到提示,或者您可以通过直接将该 Noindex 规则添加到 robots.txt 文件来避免整个事情。在上面的帖子中,马特说这将导致链接被删除。


0
投票

不,你不能。 您可以设置要阻止哪些目录以及哪些机器人,但不能通过 robots.txt 设置 nofollow 在页面上使用 robots 元标记来设置 nofollow。

© www.soinside.com 2019 - 2024. All rights reserved.