PHP CURL 未正确处理编码的返回数据

问题描述 投票:0回答:5

我有一些小的编码问题。我从这里获取一个 json 数据字符串(自己尝试一下):

http://cdn.content.easports.com/fifa/fltOnlineAssets/C74DDF38-0B11-49b0-B199-2E2A11D1CC13/2014/fut/items/web/179899.json

数据中的名字是这样显示的

Ari Skúlason

如何使用正确的编码获取此数据,使其成为 Ari Skúlason?

我尝试在 php 中将其切换为 utf-8

echo mb_convert_encoding($r,'ISO-8859-1','utf-8');

这让我更接近了,但还是不对

Ari Sk�lason

我的 php 卷曲请求:

$location = 'http://cdn.content.easports.com/fifa/fltOnlineAssets/C74DDF38-0B11-49b0-  B199-2E2A11D1CC13/2014/fut/items/web/179899.json';
$ch = curl_init($location);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HTTPHEADER, array(                                                                                                                                                        
'Accept: application/json'));
$r = curl_exec($ch);
curl_close($ch);
echo mb_detect_encoding($r);
$r = mb_convert_encoding($r,'ISO-8859-1','utf-8');

print_r($r);
php http curl encoding utf-8
5个回答
33
投票

CURLOPT_ENCODING
设置另一个curl选项并将其设置为“”以确保它不会返回任何垃圾

   curl_setopt($ch, CURLOPT_ENCODING ,"");

9
投票

您可以使用标题

   header('Content-type: text/html; charset=UTF-8');

解码字符串后

 $page = utf8_decode(curl_exec($ch));

这对我有用

curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_ENCODING, 'UTF-8');
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13) Gecko/20080311 Firefox/2.0.0.13');

添加此后

$page = curl_exec($ch);
$dom = new DOMDocument('1.0', 'utf-8');
libxml_use_internal_errors(true);
@$dom->loadHTML(mb_convert_encoding($page, 'HTML-ENTITIES', 'UTF-8'));

0
投票

你也可以尝试一下。

...

$results = curl_exec($init);
curl_close($init);
return json_decode(utf8_encode($results));

utf8_encode 编码的 ASCII 字符。返回未编码的 ASCII 可能会中断或返回错误(就我而言)。


0
投票

你可以试试

$res= curl_exec ( $ch ); 
$result = iconv("Windows-1251", "UTF-8", $res);

0
投票

检查 mb_convert_encoding 的参数顺序是否正确会有所帮助。您指定 to_encoding 作为第二个参数,然后指定 from_encoding 作为第三个参数。

所以这段代码意味着将 from utf-8 转换为 ISO-8859-1

$r = mb_convert_encoding($r,'ISO-8859-1','utf-8');

更换它们有助于解决我的问题。

© www.soinside.com 2019 - 2024. All rights reserved.