将非 ASCII 字符打印到 CSV 文件中

问题描述 投票:0回答:8

我正在尝试使用 php 创建 CSV 文件。如何打印非 ASCII 字符?

php csv non-ascii-characters
8个回答
10
投票

可以在 CSV 文件中使用 unicode 字符,只需确保使用正确的 HTTP 标头即可。这在 OpenOffice 中效果很好,但如果我没记错的话,Excel 在显示带有 unicode 字符的 CSV 文件时会出现一些问题。

此外,您应该尝试使用fputcsv,它会让事情变得更容易。当您动态创建文件时,您可以使用 php 输出流

所以像这样:

$handle = fopen("php://output", "w");

header("Content-Type: text/csv; charset=UTF-8");
fputcsv($handle, $fields, ';', '"');

fclose($handle);

编辑
阅读您的评论后,您似乎在转换像

é
这样的 htmlentities 时遇到问题。要转换这些实体,您必须确保每个字段都已解码。您可以使用 html_entity_decode 来完成此操作,如下所示:

$decoded_string = html_entity_decode($string, ENT_QUOTES, 'UTF-8');

顺便说一句,大多数时候,在数据库中存储带有 htmlentities 的文本并不是一个好主意,因为当您不想输出 html 时(就像在本例中),您必须将它们转换回真实字符。将文本存储为 unicode 会更容易。


4
投票

fputcsv 应该处理 utf-8。


1
投票

这是我使用的,我相信它可以根据您的情况进行一些改进,但总的来说非常通用并且对于许多情况都非常有用。

您只需向函数提供 sql,它就会输出一个带有列名称标题行的 csv。

<?php
function exportMysqlToCsv($csvsql,$filename = 'export.csv')
{
    $csv_terminated = "\n";
    $csv_separator = ",";
    $csv_enclosed = '"';
    $csv_escaped = "\\";
    $sql_query = $csvsql;

    // Gets the data from the database
    $result = mysql_query($sql_query);
    $fields_cnt = mysql_num_fields($result);


    $schema_insert = '';

    for ($i = 0; $i < $fields_cnt; $i++)
    {
        $l = $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed,
            stripslashes(mysql_field_name($result, $i))) . $csv_enclosed;
        $schema_insert .= $l;
        $schema_insert .= $csv_separator;
    } // end for

    $out = trim(substr($schema_insert, 0, -1));
    $out .= $csv_terminated;

    // Format the data
    while ($row = mysql_fetch_array($result))
    {
        $schema_insert = '';
        for ($j = 0; $j < $fields_cnt; $j++)
        {
            if ($row[$j] == '0' || $row[$j] != '')
            {

                if ($csv_enclosed == '')
                {
                    $schema_insert .= $row[$j];
                } else
                {
                    $meta = mysql_fetch_field($result, $j);
                    if($meta->type == "int" || $meta->type == "real")
                    {
                      $schema_insert .= $row[$j];
                    } else {
                      $schema_insert .= $csv_enclosed . str_replace($csv_enclosed, $csv_escaped . $csv_enclosed, $row[$j]) . $csv_enclosed;
                    }
                }
            } else
            {
                $schema_insert .= '';
            }

            if ($j < $fields_cnt - 1)
            {
                $schema_insert .= $csv_separator;
            }
        } // end for

        $out .= $schema_insert;
        $out .= $csv_terminated;
    } // end while

    header("Cache-Control: must-revalidate, post-check=0, pre-check=0");
    header("Content-Length: " . strlen($out));
    // Output to browser with appropriate mime type, you choose ;)
    header("Content-type: text/x-csv");
    //header("Content-type: text/csv");
    //header("Content-type: application/csv");
    header("Content-Disposition: attachment; filename=$filename");
    echo $out;
    exit;

} 
?>

0
投票

正如您所说,它们是即时生成的(即您使用

echo
等直接输出它们),那么以下内容将有所帮助:

1) 在 PHP 代码的最开头添加此标头:

 header ('Content-type: text/csv; charset=utf-8');

2)在 HTML 代码中添加此元数据:

 <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

3) 将 PHP 代码文件保存为 UTF-8 without BOM


0
投票

当您选择网页的页面信息时,请检查文件编码是什么。它应该是UTF-8。如果不是,则您输出的数据不是 UTF。
另请注意您的浏览器设置的字符编码。在 Firefox 中,它位于菜单->视图->字符编码中。


0
投票

实际上 shamittomar 的回答非常好,但它错过了一件事

您的问题与您的编码有关
您应该将文本编码转换为 UTF-8 因为 php 内部使用 ascii

示例:

$str = mb_convert_encoding($str , "UTF-8") ; 

请参阅 php.net 了解更多信息


0
投票

我发现的最好的例子就是这个。

    function str_to_csv($row) {
        if ($row == '') {
            return array();
        }
        $a = array();
        $src = explode(',', $row);
        do {
            $p = array_shift($src);
            while (mb_substr_count($p, '"') % 2 != 0) {
                if (count($src) == 0) {
                    return false;
                }
                $p .= ',' . array_shift($src);
            }
            $match = null;
            if (preg_match('/^"(.+)"[\r\n]*$/', $p, $match)) {
                $p = $match[1];
            }
            $a[] = str_replace('""', '"', $p);
        } while (count($src) > 0);
        return $a;
    }

    function file_getcsv($f) {
        $line = fgets($f);
        while (($a = str_to_csv($line)) === false) {
            if (feof($f)) {
                return false;
            }
            $line .= "\n" . fgets($f);
        }
        return $a;
    }

    function file_to_csv($filename) {
        ini_set("auto_detect_line_endings", true);
        $a = array();
        $f = fopen($filename, 'r');
        while (!feof($f)) {
            $rec = file_getcsv($f);
            if ($rec === false) {
                return false;
            }
            if (!empty($rec)) {
                $a[] = $rec;
            }
        }
        fclose($f);
        return $a;
    }

    $data = file_to_csv('base2.csv');

    echo '<pre>';
    print_r($data);

0
投票

简单地,使用

utf8_encode()
函数,在您想要打印或获取非 ASCII 字符的地方。

© www.soinside.com 2019 - 2024. All rights reserved.