robots.txt 相关问题

Robots.txt（机器人排除协议）是放置在网站域根目录中的文本文件，用于向兼容的Web机器人（例如搜索引擎爬虫）提供有关要爬网和不爬网的页面的说明，以及其他信息例如Sitemap位置。在现代框架中，以编程方式生成文件可能很有用。有关搜索引擎优化的一般问题更适合Webmasters StackExchange站点。

如何在robot.txt文件中阻止此类URL？

这里有两组条件，我想用 /search/jobdescription 阻止所有网址？和搜索/职位描述/ http://<--sitename-->/search/jobdescription?id=0154613&css=a&act=a ...

php url robots.txt

回答 2 投票 0

301 重定向完整网址

如何创建重定向以便 http://fullurl/store 重定向到 https://fullurl/商店我是在 htaccess 还是 robots 中执行此操作？

.htaccess robots.txt http-redirect

回答 1 投票 0

Robots.txt 中没有索引

我有一个wordpress网站，已在搜索引擎中建立索引。我已编辑 Robots.txt 以禁止搜索索引中的某些目录和网页。我只知道如何使用允许和禁止...

seo search-engine robots.txt nofollow

回答 3 投票 0

wordpress 机器人 [已关闭]

我的永久链接是这样的%postname%/ 然后我把它改成这样 /%post_id%/%postname%/ 现在的问题是谷歌机器人仍然索引帖子名称并将其报告为未找到，所以我想添加一个l...

wordpress permalinks robots.txt

回答 1 投票 0

mod_rewrite 所有 robots.txt 请求到服务器范围内的默认文件

所以，我有一个使用 apache 运行 OpenSuse 的开发服务器。该服务器上有大量项目，其中一些有在线/实时对应项目。每个项目都有一个单独的子域。怎么...

.htaccess mod-rewrite apache2 robots.txt

回答 2 投票 0

站长工具说 robots.txt 无法访问，但它存在

我在使用新网站时遇到了真正的问题，我正在尝试在谷歌网站管理员工具中配置该网站。我不断收到消息“无法访问 robots.txt”，并且 google 说它无法抓取我的网站，因为...

robots.txt

回答 2 投票 0

机器人文本被阻止

header("内容类型：文本/纯文本；字符集=utf-8"); 如果（$_SERVER['SERVER_PORT'] == 443）{ echo "用户代理: * ”; 回声“不允许：/ ”; } 别的 { echo "用户代理: * ”; 回声“不允许： ”; } W...

php robots.txt

回答 1 投票 0

在 WordPress 机器人上禁止 /feed 和 /trackback，但 Google 仍在索引

我的网站和 robots.txt 文件出现问题。我的机器人上不允许使用 /feed 和 /trackback url，但由于某种原因，我仍然收到我的 Google 网站管理员 url，例如 http://www.myd...

wordpress robots.txt trackback

回答 2 投票 0

不要在同一托管的多个域上抓取某些页面

我有一个托管帐户，上面停有 2 个域名，网站通过读取正在使用的域名来显示不同的内容。 Google 会抓取此内容并将这 2 个域列为不同的网站...

.htaccess web-crawler robots.txt

回答 1 投票 0

如何让开发网站Noindex Nofollow，但生产没有

我有一个joomla 3.3开发站点和一个生产站点。我在开发站点中进行所有开发，每次将开发推向生产时，我都需要确保我查...

joomla meta robots.txt nofollow noindex

回答 3 投票 0

机器人每天访问网站 1k+ 次 [已关闭]

我很难确定是什么原因导致我的网站加载速度极慢，我找到了一些东西，但谷歌档案没有提供正确的答案，甚至没有提供解释。在我的原始访问中...

bots prestashop robots.txt

回答 2 投票 0

Magento robots.txt 404s

我安装了 Magento 多站点。我只想禁止我的一家商店，而不是其他商店。我正在尝试利用 Magento 配置上的“默认机器人”选项，所以我...

.htaccess magento robots.txt

回答 1 投票 0

robots.txt 文件中 /*+* 的含义是什么？

我有一个关于 robots.txt 文件的问题。禁止：博客/*+* 这是什么意思？

robots.txt

回答 1 投票 0

如何在nextjs 14.1中添加robots.txt文件

我想在我的 nextjs 14 网站中添加 robots.txt 文件，我尝试了一些方法，但没有任何效果。动态生成robots.txt文件的正确方法是什么？现在是我尝试独立的时候了...

next.js robots.txt

回答 1 投票 0

WP 站点的 Live Robots.txt 与通过 SFTP 访问的本地 Robots.txt 不同

我有一个托管在 WPEngine 上的 Wordpress 站点，它通过端点充当我们网站的 CMS。在Wordpress网站上，我安装了YoastSEO插件，并编辑了robots.txt文件...

wordpress web-crawler seo robots.txt wpengine

回答 1 投票 0

如何禁止.htaccess和robots.txt中的机器人？

我尝试禁止 Amazonbot 访问我的网站，并尝试通过添加以下行来使用 robots.txt：用户代理：Amazonbot 不允许： / 几个小时后，我注意到这个机器人没有跟随 robots.t...

.htaccess robots.txt

回答 1 投票 0

关于机器人。文本

如果我将 robots.txt 文件中的用户代理留空会怎样？基本上是这样的：用户代理： * 禁止：/特定页面但如果是这样呢：用户代理：禁止：/特定页面

seo robots.txt

回答 1 投票 0

Nuxt3 Robots.txt - @nuxtjs/robots 未生成 robots.txt 文件

我正在构建一个 Nuxt 3 项目。我需要我的构建来生成 robots.txt 文件，就像这个包声明的那样 -> https://github.com/nuxt-community/robots-module 运行“nuxt bu...

javascript nuxt.js robots.txt nuxtjs3

回答 6 投票 0

添加robots.txt并隐藏它的正确方法？

我的主机上有一个秘密文件夹，访问者可能看不到该文件夹。我已将 robots.txt 添加到 htdocs：用户代理： * 禁止：/超级私人/ 但是，如果访问者访问 http://example.com/

authentication robots.txt

回答 2 投票 0

在python中解析Robots.txt

我想用python解析robots.txt文件。我已经探索了 robotsParser 和 robotsExclusionParser，但没有什么真正满足我的标准。我想获取所有 diallowedUrls 和 allowedUrls 中的...

python robots.txt

回答 4 投票 0

robots.txt 相关问题

最新问题