我已经使用Google自定义搜索为我的网站创建了自定义搜索引擎。为此,我正在使用其他Google帐户。自定义搜索文本字段出现的页面具有以下代码:<script>
(function() {
var cx = '016767413532501348949:fxidfvgzwa0';
var gcse = document.createElement('script');
gcse.type = 'text/javascript';
gcse.async = true;
gcse.src = (document.location.protocol == 'https:' ? 'https:' : 'http:') +
'//www.google.com/cse/cse.js?cx=' + cx;
var s = document.getElementsByTagName('script')[0];
s.parentNode.insertBefore(gcse, s);
})();
</script>
<gcse:search></gcse:search>
当我搜索某个记录时说'test',它用来显示在开发的早期阶段创建的所有测试页(html)。然后,我从服务器上删除了这些页面,并使用网站管理员工具https://www.google.com/webmasters/tools/从Google的缓存中删除了这些页面(我使用相同的google帐户来实现这一目的,并且此页面现在显示这些页面已从缓存中删除。)再次使用其中一个jsp来显示这些测试记录的链接,但现在却不显示,甚至这个jsp也通过通过请求google。我不明白为什么该jsp链接与自定义搜索中的那些测试记录一起显示,当您单击此链接时,它显示更新的页面。
仍然是这种情况吗?您是否在谈论实际数据,例如来自文件或称为test.html或类似页面的数据?现在应该已经对您的网站进行了重新爬网,以排除这些页面。
您可以使用cse工具的自定义选项排除特定的页面,或使用exclude by url pattern排除页面名称中的单词test或排除特定的子域/目录。将来可能会对您有所帮助。 url patterns