robots.txt 相关问题

Robots.txt(机器人排除协议)是放置在网站域根目录中的文本文件,用于向兼容的Web机器人(例如搜索引擎爬虫)提供有关要爬网和不爬网的页面的说明,以及其他信息例如Sitemap位置。在现代框架中,以编程方式生成文件可能很有用。有关搜索引擎优化的一般问题更适合Webmasters StackExchange站点。

关于robots.txt禁止使用参数网址

我有以搜索结果结尾的页面?=关键字,我希望Google阻止对这些页面进行爬网。示例页面如下。我想知道是否将Disallow:/ search放在robots.txt中,是否会...

回答 1 投票 0

如何为手机和台式机上具有不同页面的网站创建站点地图?

我有一个网站,它具有两个不同的页面结构-一个用于移动访问者,一个用于桌面。这就是为什么我有两个站点地图文件-一个用于移动设备,一个用于台式机。我想创建一个...

回答 5 投票 1

Robots.txt禁用例外情况下的查询参数扫描

我正在执行一些SEO更改,包括robots.txt更改,并且正在解决此问题。我需要禁用(或精确地说是不允许的)每个包含某些查询URL参数的URL(?xy = ...)所以...

回答 1 投票 0

如何从javascript webpack项目提供robots.txt

我一直在为此奋斗,但徒劳无功。我正在接管这个Webpack项目,该项目需要从其目录级别运行robots.txt文件,但是我无法使其路由正常工作。我...

回答 1 投票 1

robots.txt中的美元符号是什么意思

我对网站感到好奇,并希望在/ s路径上进行一些网络爬网。它的robots.txt:User-Agent:*允许:/ $允许:/ debug /允许:/ qa /允许:/ wiki /允许:/ cgi-bin / loginpage不允许:/ ...

回答 2 投票 5

如何在Sitefinity mvc中创建Robots.txt编辑器?

我想在Sitefinity中为Robots.txt文件创建一个编辑器。我想让用户能够编辑它。我该怎么做呢?我正在使用最新版本的Sitefinity和MVC。任何示例或...

回答 1 投票 -1

robots.txt文件或控制它的配置是否存在备用位置?

我们有一个网站,其中许多应用程序都配置为子站点。目前,没有网站被google正确索引。我假设这是由于robots.txt文件所致...

回答 1 投票 1

如何在ASP.Net Core中使用Robots.txt?

我想在我的ASP.NET Core(3.1)项目上使用我的Robots.txt并将其复制到根文件夹和wwwroot文件夹,但似乎不起作用,在ASP.NET MVC上也是如此工作良好。之后...

回答 1 投票 -1

robots.txt是否已更改?

我在路由目录中有以下简单的robots.txt文件:Sitemap:mySite.com/sitemap.xml用户代理:* Disallow:我相信在allowallow之后没有任何内容:允许对每个页面进行爬网。 ...

回答 1 投票 0

robots.txt文件是否已被覆盖/从外部来源注入?

[我们有两个Wordpress网站都存在相同的问题。他们似乎有一个包含以下内容的“ robots.txt”文件:User-Agent:*抓取延迟:300 User-Agent:MJ12bot不允许:/ User -...

回答 2 投票 0

我已禁止10天的一切

由于更新错误,我将要用于测试服务器的robots.txt文件放入文件中。结果,产品最终以以下robots.txt结尾:User-Agent:*不允许:/那是10天前的事,现在我......>

回答 1 投票 0

robots.txt-用户代理块之间需要空白行,还是可选的?

权威文档来源中给出的看似矛盾的描述。机器人排除的标准:(“记录”指的是每个用户代理块)“该文件包含一个或多个...

回答 1 投票 0

多站点TYPO3 v9,一个根页上有多个域的不同robots.txt

出于营销目的,我维护一个具有两个不同域的相同网站,在TYPO3 v8中,我只需在根页面上添加域记录,然后使用...

回答 1 投票 0

如何告诉Google停止关注某些链接[关闭]

我有一个页面www.example / sample.html,该页面的主体中有一些链接。即YahooBing

回答 1 投票 0

不允许标题页robots.txt

我想禁止robots.txt中的header.php被索引。文件网址https://example.com/header.php,但我不确定是正确的:Disallow:/header.php或Disallow:header.php谢谢

回答 1 投票 0

PrestaShop robots.txt和/ module /路径索引

朋友。我对PrestaShop现成的robots.txt文件有疑问。允许搜索引擎索引PrestaShop * / module / *路线是一种正常的做法吗?可以请别人发表评论:A)...

回答 2 投票 0

搜索引擎和机器人文件

我有一个文字新闻网站,不希望Google抓取我的媒体特定文件夹中的文档。我创建了一个robot.txt文件,该文件不允许该路径,但我刚刚发现该Google ...

回答 1 投票 -1

这可能是因为该页面不可用或被robots.txt阻止了

我的robots.txt文件:用户代理:*不允许:/ wp-admin /允许:/wp-admin/admin-ajax.php当我在Google移动友好版上测试WordPress网站时,出现此错误:页面无法达到此...

回答 1 投票 0

Google索引:robots.txt,以停止wp上载索引编制

我有一个正在被Google索引的Wordpress网站,但是google正在将图像作为搜索结果-即,如果我这样做site:mysite.com,我会看到大量的结果,当单击它们时,只需转到图像.. 。

回答 1 投票 0

如何阻止搜索引擎为根目录.php和.html文件以外的文件和子目录建立索引,而不列出目录名称?

我想这样做,以便搜索引擎仅索引我的网站根目录中的.html和.php文件,而没有子目录。我要执行此操作,而无需实际列出显式目录...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.