当请求缺少用户代理时,Wikipedia API 会给出 HTTP 403

问题描述 投票:0回答:2

我在使用维基百科 API 时遇到问题。我使用这个 PHP 脚本,

<?php
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

我在浏览器中得到以下结果。为什么?

警告: DOMDocument::load(http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml) [domdocument.load]:打开失败 流:HTTP 请求失败! HTTP/1.0 403 D:\Program 中禁止 文件\VertrigoServ\www\wiki\index.php 3号线

警告:DOMDocument::load() [domdocument.load]:I/O 警告: 加载外部实体失败 “http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml” 在D:\程序中 文件\VertrigoServ\www\wiki\index.php 3号线

php api wiki wikipedia
2个回答
2
投票
<?php
  $vars = array(
    'http' => array(
      'user_agent' =>'whatever'));
  $context = stream_context_create($vars);
  libxml_set_streams_context($context);
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

不要问我为什么需要用户代理,但我在这里看到越来越多相同的问题,所有这些都可以通过提供用户代理来解决。


编辑: 以下也可以工作(在这里可以):

<?php
  ini_set('user_agent','whatever');
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

也许 PHP 中的默认设置

user_agent
已更改?


2
投票

对于 MediaWiki 的用户代理政策: http://meta.wikimedia.org/wiki/User-Agent_policy

© www.soinside.com 2019 - 2024. All rights reserved.