robots.txt 相关问题

Robots.txt(机器人排除协议)是放置在网站域根目录中的文本文件,用于向兼容的Web机器人(例如搜索引擎爬虫)提供有关要爬网和不爬网的页面的说明,以及其他信息例如Sitemap位置。在现代框架中,以编程方式生成文件可能很有用。有关搜索引擎优化的一般问题更适合Webmasters StackExchange站点。

如何在robot.txt文件中阻止此类URL?

这里有两组条件,我想用 /search/jobdescription 阻止所有网址?和搜索/职位描述/ http://<--sitename-->/search/jobdescription?id=0154613&css=a&act=a ...

回答 2 投票 0

301 重定向完整网址

如何创建重定向以便 http://fullurl/store 重定向到 https://fullurl/商店 我是在 htaccess 还是 robots 中执行此操作?

回答 1 投票 0

Robots.txt 中没有索引

我有一个wordpress网站,已在搜索引擎中建立索引。 我已编辑 Robots.txt 以禁止搜索索引中的某些目录和网页。 我只知道如何使用允许和禁止...

回答 3 投票 0

wordpress 机器人 [已关闭]

我的永久链接是这样的%postname%/ 然后我把它改成这样 /%post_id%/%postname%/ 现在的问题是谷歌机器人仍然索引帖子名称并将其报告为未找到,所以我想添加一个l...

回答 1 投票 0

mod_rewrite 所有 robots.txt 请求到服务器范围内的默认文件

所以,我有一个使用 apache 运行 OpenSuse 的开发服务器。该服务器上有大量项目,其中一些有在线/实时对应项目。 每个项目都有一个单独的子域。 怎么...

回答 2 投票 0

站长工具说 robots.txt 无法访问,但它存在

我在使用新网站时遇到了真正的问题,我正在尝试在谷歌网站管理员工具中配置该网站。我不断收到消息“无法访问 robots.txt”,并且 google 说它无法抓取我的网站,因为...

回答 2 投票 0

机器人文本被阻止

header("内容类型:文本/纯文本;字符集=utf-8"); 如果($_SERVER['SERVER_PORT'] == 443){ echo "用户代理: * ”; 回声“不允许:/ ”; } 别的 { echo "用户代理: * ”; 回声“不允许: ”; } W...

回答 1 投票 0

在 WordPress 机器人上禁止 /feed 和 /trackback,但 Google 仍在索引

我的网站和 robots.txt 文件出现问题。我的机器人上不允许使用 /feed 和 /trackback url,但由于某种原因,我仍然收到我的 Google 网站管理员 url,例如 http://www.myd...

回答 2 投票 0

不要在同一托管的多个域上抓取某些页面

我有一个托管帐户,上面停有 2 个域名,网站通过读取正在使用的域名来显示不同的内容。 Google 会抓取此内容并将这 2 个域列为不同的网站...

回答 1 投票 0

如何让开发网站Noindex Nofollow,但生产没有

我有一个joomla 3.3开发站点和一个生产站点。我在开发站点中进行所有开发,每次将开发推向生产时,我都需要确保我查...

回答 3 投票 0

机器人每天访问网站 1k+ 次 [已关闭]

我很难确定是什么原因导致我的网站加载速度极慢,我找到了一些东西,但谷歌档案没有提供正确的答案,甚至没有提供解释。 在我的原始访问中...

回答 2 投票 0

Magento robots.txt 404s

我安装了 Magento 多站点。我只想禁止我的一家商店,而不是其他商店。我正在尝试利用 Magento 配置上的“默认机器人”选项,所以我...

回答 1 投票 0

robots.txt 文件中 /*+* 的含义是什么?

我有一个关于 robots.txt 文件的问题。 禁止:博客/*+* 这是什么意思?

回答 1 投票 0

如何在nextjs 14.1中添加robots.txt文件

我想在我的 nextjs 14 网站中添加 robots.txt 文件,我尝试了一些方法,但没有任何效果。 动态生成robots.txt文件的正确方法是什么?现在是我尝试独立的时候了...

回答 1 投票 0

WP 站点的 Live Robots.txt 与通过 SFTP 访问的本地 Robots.txt 不同

我有一个托管在 WPEngine 上的 Wordpress 站点,它通过端点充当我们网站的 CMS。 在Wordpress网站上,我安装了YoastSEO插件,并编辑了robots.txt文件...

回答 1 投票 0

如何禁止.htaccess和robots.txt中的机器人?

我尝试禁止 Amazonbot 访问我的网站,并尝试通过添加以下行来使用 robots.txt: 用户代理:Amazonbot 不允许: / 几个小时后,我注意到这个机器人没有跟随 robots.t...

回答 1 投票 0

关于机器人。文本

如果我将 robots.txt 文件中的用户代理留空会怎样? 基本上是这样的: 用户代理: * 禁止:/特定页面 但如果是这样呢: 用户代理: 禁止:/特定页面

回答 1 投票 0

Nuxt3 Robots.txt - @nuxtjs/robots 未生成 robots.txt 文件

我正在构建一个 Nuxt 3 项目。我需要我的构建来生成 robots.txt 文件,就像这个包声明的那样 -> https://github.com/nuxt-community/robots-module 运行“nuxt bu...

回答 6 投票 0

添加robots.txt并隐藏它的正确方法?

我的主机上有一个秘密文件夹,访问者可能看不到该文件夹。我已将 robots.txt 添加到 htdocs: 用户代理: * 禁止:/超级私人/ 但是,如果访问者访问 http://example.com/

回答 2 投票 0

在python中解析Robots.txt

我想用python解析robots.txt文件。 我已经探索了 robotsParser 和 robotsExclusionParser,但没有什么真正满足我的标准。我想获取所有 diallowedUrls 和 allowedUrls 中的...

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.