将 Visual Studio 项目中的所有文件保存为 UTF-8

问题描述 投票:0回答:14

我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们全部相同(带签名的 UTF-8)。

我知道如何保存单个文件,但是项目中的所有文件怎么样?

visual-studio utf-8 character-encoding
14个回答
77
投票

既然您已经在 Visual Studio 中,为什么不直接编写代码呢?

foreach (var f in new DirectoryInfo(@"...").GetFiles("*.cs", SearchOption.AllDirectories)) {
  string s = File.ReadAllText(f.FullName);
  File.WriteAllText (f.FullName, s, Encoding.UTF8);
}

只需三行代码!我相信你可以在不到一分钟的时间内写出这个:-)


41
投票

这可能会有所帮助。

由于原始参考资料被垃圾邮件网站损坏,链接已被删除。

简短版本:编辑一个文件,选择文件 -> 高级保存选项。不要将 UTF-8 更改为 Ascii,而是将其更改为 UTF-8。 编辑:确保选择无字节顺序标记 (BOM) 的选项

设置代码页并点击确定。它似乎持续存在于当前文件之后。


12
投票

如果您需要在 PowerShell 中执行此操作,这是我的小举动:

Function Write-Utf8([string] $path, [string] $filter='*.*')
{
    [IO.SearchOption] $option = [IO.SearchOption]::AllDirectories;
    [String[]] $files = [IO.Directory]::GetFiles((Get-Item $path).FullName, $filter, $option);
    foreach($file in $files)
    {
        "Writing $file...";
        [String]$s = [IO.File]::ReadAllText($file);
        [IO.File]::WriteAllText($file, $s, [Text.Encoding]::UTF8);
    }
}

8
投票

我会以编程方式(在 VS 之外)转换文件,例如使用 Python 脚本:

import glob, codecs

for f in glob.glob("*.py"):
    data = open("f", "rb").read()
    if data.startswith(codecs.BOM_UTF8):
        # Already UTF-8
        continue
    # else assume ANSI code page
    data = data.decode("mbcs")
    data = codecs.BOM_UTF8 + data.encode("utf-8")
    open("f", "wb").write(data)

这假设所有不在“带签名的 UTF-8”中的文件都在 ANSI 代码页中 - 这与 VS 2008 显然也假设的相同。如果您知道某些文件具有不同的编码,则必须指定这些编码是什么。


6
投票

使用C#:
1) 创建一个新的 ConsoleApplication,然后安装 Mozilla 通用字符集检测器
2)运行代码:

static void Main(string[] args)
{
    const string targetEncoding = "utf-8";
    foreach (var f in new DirectoryInfo(@"<your project's path>").GetFiles("*.cs", SearchOption.AllDirectories))
    {
        var fileEnc = GetEncoding(f.FullName);
        if (fileEnc != null && !string.Equals(fileEnc, targetEncoding, StringComparison.OrdinalIgnoreCase))
        {
            var str = File.ReadAllText(f.FullName, Encoding.GetEncoding(fileEnc));
            File.WriteAllText(f.FullName, str, Encoding.GetEncoding(targetEncoding));
        }
    }
    Console.WriteLine("Done.");
    Console.ReadKey();
}

private static string GetEncoding(string filename)
{
    using (var fs = File.OpenRead(filename))
    {
        var cdet = new Ude.CharsetDetector();
        cdet.Feed(fs);
        cdet.DataEnd();
        if (cdet.Charset != null)
            Console.WriteLine("Charset: {0}, confidence: {1} : " + filename, cdet.Charset, cdet.Confidence);
        else
            Console.WriteLine("Detection failed: " + filename);
        return cdet.Charset;
    }
}

1
投票

我创建了一个函数来更改用 asp.net 编写的编码文件。 我搜索了很多。我还使用了此页面中的一些想法和代码。谢谢你。

这是函数。

  Function ChangeFileEncoding(pPathFolder As String, pExtension As String, pDirOption As IO.SearchOption) As Integer

    Dim Counter As Integer
    Dim s As String
    Dim reader As IO.StreamReader
    Dim gEnc As Text.Encoding
    Dim direc As IO.DirectoryInfo = New IO.DirectoryInfo(pPathFolder)
    For Each fi As IO.FileInfo In direc.GetFiles(pExtension, pDirOption)
        s = ""
        reader = New IO.StreamReader(fi.FullName, Text.Encoding.Default, True)
        s = reader.ReadToEnd
        gEnc = reader.CurrentEncoding
        reader.Close()

        If (gEnc.EncodingName <> Text.Encoding.UTF8.EncodingName) Then
            s = IO.File.ReadAllText(fi.FullName, gEnc)
            IO.File.WriteAllText(fi.FullName, s, System.Text.Encoding.UTF8)
            Counter += 1
            Response.Write("<br>Saved #" & Counter & ": " & fi.FullName & " - <i>Encoding was: " & gEnc.EncodingName & "</i>")
        End If
    Next

    Return Counter
End Function

它可以放在.aspx文件中,然后像这样调用:

ChangeFileEncoding("C:\temp\test", "*.ascx", IO.SearchOption.TopDirectoryOnly)

1
投票

如果您将 TFS 与 VS 一起使用: http://msdn.microsoft.com/en-us/library/1yft8zkw(v=vs.100).aspx 示例:

tf checkout -r -type:utf-8 src/*.aspx

1
投票

感谢您的解决方案,这段代码对我有用:

Dim s As String = ""
Dim direc As DirectoryInfo = New DirectoryInfo("Your Directory path")

For Each fi As FileInfo In direc.GetFiles("*.vb", SearchOption.AllDirectories)
    s = File.ReadAllText(fi.FullName, System.Text.Encoding.Default)
    File.WriteAllText(fi.FullName, s, System.Text.Encoding.Unicode)
Next

1
投票

如果您想避免此类错误:

使用以下代码:

foreach (var f in new DirectoryInfo(@"....").GetFiles("*.cs", SearchOption.AllDirectories))
            {
                string s = File.ReadAllText(f.FullName, Encoding.GetEncoding(1252));
                File.WriteAllText(f.FullName, s, Encoding.UTF8);
            }

编码号 1252 是 Visual Studio 用于保存文件的默认 Windows 编码。


1
投票

从 UTF-8-BOM 转换为 UTF-8

基于 rasx 的回答,这里有一个 PowerShell 函数,它假设您当前的文件已经以 UTF-8 编码(但可能带有 BOM),并将它们转换为不带 BOM 的 UTF-8,从而保留现有的 Unicode 字符。

Function Write-Utf8([string] $path, [string] $filter='*')
{
    [IO.SearchOption] $option = [IO.SearchOption]::AllDirectories;
    [String[]] $files = [IO.Directory]::GetFiles((Get-Item $path).FullName, $filter, $option);
    foreach($file in $files)
    {
        "Writing $file...";
        [String]$s = [IO.File]::ReadAllText($file, [Text.Encoding]::UTF8);
        [Text.Encoding]$e = New-Object -TypeName Text.UTF8Encoding -ArgumentList ($false);
        [IO.File]::WriteAllText($file, $s, $e);
    }
}

0
投票

将解决方案从 VS2008 转换为 VS2015 后遇到编码问题。转换后,所有项目文件都以 ANSI 编码,但它们包含 UTF8 内容,并在 VS2015 中被识别为 ANSI 文件。尝试了很多转换策略,但只有这个解决方案有效。

 Encoding encoding = Encoding.Default;
 String original = String.Empty;
 foreach (var f in new DirectoryInfo(path).GetFiles("*.cs", SearchOption.AllDirectories))
 {
    using (StreamReader sr = new StreamReader(f.FullName, Encoding.Default))
    {
       original = sr.ReadToEnd();
       encoding = sr.CurrentEncoding;
       sr.Close();
    }
    if (encoding == Encoding.UTF8)
       continue;
    byte[] encBytes = encoding.GetBytes(original);
    byte[] utf8Bytes = Encoding.Convert(encoding, Encoding.UTF8, encBytes);
    var utf8Text = Encoding.UTF8.GetString(utf8Bytes);

    File.WriteAllText(f.FullName, utf8Text, Encoding.UTF8);
 }

0
投票

该项目已从 Visual Studio 2017 的菜单中删除 您仍然可以通过“文件”->“另存为”-> 然后单击“保存”按钮上的向下箭头并单击“使用编码保存...”来访问该功能。

如果需要,您还可以通过“工具”->“自定义”->“命令”将其添加回“文件”菜单。


0
投票

现在最好的解决方案是添加到

.editorconfig
文件中的
[*.cs]
(或任何你想要的格式)部分:

charset = utf-8

例如,我的

.editorconfig
开头为:

[*.cs]

charset = utf-8

如果需要,您也可以使用

utf-8-bom

接下来是在包含解决方案文件的文件夹中运行dotnet format命令,它将完成这项工作。

完成!


-1
投票

我只是提供此建议,以防万一无法在 Visual Studio 中自动执行此操作(我什至不确定这是否有效):

  1. 在项目中创建一个名为 足の不自由なハッキング 的类(或其他一些强制 Visual Studio 编码为 UTF-8 的 unicode 文本)。
  2. 添加“使用MyProject。足の不自由なハッキング;”到每个文件的顶部。您应该能够通过全局替换“using System.Text;”来完成所有操作。与“使用 System.Text;使用 MyProject。足の不自由なハッキング;”。
  3. 保存一切。您可能会收到一长串“Do you Want to save X.cs using UTF-8?”消息什么的。
© www.soinside.com 2019 - 2024. All rights reserved.