UTF-16到UTF-8转换(用于Windows中的脚本)

问题描述 投票:10回答:6

将UTF-16文件转换为UTF-8的最佳方法是什么?我需要在cmd脚本中使用它。

windows utf-8 batch-file cmd utf-16
6个回答
20
投票

有一个GNU工具recode,你也可以在Windows上使用它。例如。

recode utf16..utf8 text.txt

15
投票

Ruby的另一种选择是在C#中编写一个小的.NET程序(.NET 1.0会很好,虽然2.0会更简单:) - 这是一个非常简单的代码。您是否希望在没有任何其他应用程序的情况下完成此操作?如果你想要一些代码来做,请添加评论,我会填写答案......

编辑:好的,这没有任何错误检查,但......

using System;
using System.IO;
using System.Text;

class FileConverter
{
  static void Main(string[] args)
  {
    string inputFile = args[0];
    string outputFile = args[1];
    using (StreamReader reader = new StreamReader(inputFile, Encoding.Unicode))
    {
      using (StreamWriter writer = new StreamWriter(outputFile, false, Encoding.UTF8))
      {
        CopyContents(reader, writer);
      }
    }
  }

  static void CopyContents(TextReader input, TextWriter output)
  {
    char[] buffer = new char[8192];
    int len;
    while ((len = input.Read(buffer, 0, buffer.Length)) != 0)
    {
      output.Write(buffer, 0, len);
    }
  }
}

7
投票

当然,最简单的方法是将脚本加载到记事本中,然后使用UTF-8编码再次保存。这是“另存为”对话框中的一个选项。


7
投票

也许与iconv


1
投票

如果您安装了ruby发行版,则可以调用ruby脚本来处理转换:

Ruby script to convert file(s) character encoding

本着同样的精神:Perl script

在没有脚本支持的情况下,你必须使用WideCharToMultiByte()调用来编码它像C++ source ...


0
投票

您可以使用内置的PowerShell cmdlet轻松完成此操作,您可以从cmd调用它:

C:\> powershell -c "Get-Content mytext.txt | Set-Content -Encoding utf8 mytext_utf8.txt"
© www.soinside.com 2019 - 2024. All rights reserved.