我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们全部相同(带签名的 UTF-8)。
我知道如何保存单个文件,但是项目中的所有文件怎么样?
既然您已经在 Visual Studio 中,为什么不直接编写代码呢?
foreach (var f in new DirectoryInfo(@"...").GetFiles("*.cs", SearchOption.AllDirectories)) {
string s = File.ReadAllText(f.FullName);
File.WriteAllText (f.FullName, s, Encoding.UTF8);
}
只需三行代码!我相信你可以在不到一分钟的时间内写出这个:-)
这可能会有所帮助。
由于原始参考资料被垃圾邮件网站损坏,链接已被删除。
简短版本:编辑一个文件,选择文件 -> 高级保存选项。不要将 UTF-8 更改为 Ascii,而是将其更改为 UTF-8。 编辑:确保选择无字节顺序标记 (BOM) 的选项
设置代码页并点击确定。它似乎持续存在于当前文件之后。
如果您需要在 PowerShell 中执行此操作,这是我的小举动:
Function Write-Utf8([string] $path, [string] $filter='*.*')
{
[IO.SearchOption] $option = [IO.SearchOption]::AllDirectories;
[String[]] $files = [IO.Directory]::GetFiles((Get-Item $path).FullName, $filter, $option);
foreach($file in $files)
{
"Writing $file...";
[String]$s = [IO.File]::ReadAllText($file);
[IO.File]::WriteAllText($file, $s, [Text.Encoding]::UTF8);
}
}
我会以编程方式(在 VS 之外)转换文件,例如使用 Python 脚本:
import glob, codecs
for f in glob.glob("*.py"):
data = open("f", "rb").read()
if data.startswith(codecs.BOM_UTF8):
# Already UTF-8
continue
# else assume ANSI code page
data = data.decode("mbcs")
data = codecs.BOM_UTF8 + data.encode("utf-8")
open("f", "wb").write(data)
这假设所有不在“带签名的 UTF-8”中的文件都在 ANSI 代码页中 - 这与 VS 2008 显然也假设的相同。如果您知道某些文件具有不同的编码,则必须指定这些编码是什么。
使用C#:
1) 创建一个新的 ConsoleApplication,然后安装 Mozilla 通用字符集检测器
2)运行代码:
static void Main(string[] args)
{
const string targetEncoding = "utf-8";
foreach (var f in new DirectoryInfo(@"<your project's path>").GetFiles("*.cs", SearchOption.AllDirectories))
{
var fileEnc = GetEncoding(f.FullName);
if (fileEnc != null && !string.Equals(fileEnc, targetEncoding, StringComparison.OrdinalIgnoreCase))
{
var str = File.ReadAllText(f.FullName, Encoding.GetEncoding(fileEnc));
File.WriteAllText(f.FullName, str, Encoding.GetEncoding(targetEncoding));
}
}
Console.WriteLine("Done.");
Console.ReadKey();
}
private static string GetEncoding(string filename)
{
using (var fs = File.OpenRead(filename))
{
var cdet = new Ude.CharsetDetector();
cdet.Feed(fs);
cdet.DataEnd();
if (cdet.Charset != null)
Console.WriteLine("Charset: {0}, confidence: {1} : " + filename, cdet.Charset, cdet.Confidence);
else
Console.WriteLine("Detection failed: " + filename);
return cdet.Charset;
}
}
我创建了一个函数来更改用 asp.net 编写的编码文件。 我搜索了很多。我还使用了此页面中的一些想法和代码。谢谢你。
这是函数。
Function ChangeFileEncoding(pPathFolder As String, pExtension As String, pDirOption As IO.SearchOption) As Integer
Dim Counter As Integer
Dim s As String
Dim reader As IO.StreamReader
Dim gEnc As Text.Encoding
Dim direc As IO.DirectoryInfo = New IO.DirectoryInfo(pPathFolder)
For Each fi As IO.FileInfo In direc.GetFiles(pExtension, pDirOption)
s = ""
reader = New IO.StreamReader(fi.FullName, Text.Encoding.Default, True)
s = reader.ReadToEnd
gEnc = reader.CurrentEncoding
reader.Close()
If (gEnc.EncodingName <> Text.Encoding.UTF8.EncodingName) Then
s = IO.File.ReadAllText(fi.FullName, gEnc)
IO.File.WriteAllText(fi.FullName, s, System.Text.Encoding.UTF8)
Counter += 1
Response.Write("<br>Saved #" & Counter & ": " & fi.FullName & " - <i>Encoding was: " & gEnc.EncodingName & "</i>")
End If
Next
Return Counter
End Function
它可以放在.aspx文件中,然后像这样调用:
ChangeFileEncoding("C:\temp\test", "*.ascx", IO.SearchOption.TopDirectoryOnly)
如果您将 TFS 与 VS 一起使用: http://msdn.microsoft.com/en-us/library/1yft8zkw(v=vs.100).aspx 示例:
tf checkout -r -type:utf-8 src/*.aspx
感谢您的解决方案,这段代码对我有用:
Dim s As String = ""
Dim direc As DirectoryInfo = New DirectoryInfo("Your Directory path")
For Each fi As FileInfo In direc.GetFiles("*.vb", SearchOption.AllDirectories)
s = File.ReadAllText(fi.FullName, System.Text.Encoding.Default)
File.WriteAllText(fi.FullName, s, System.Text.Encoding.Unicode)
Next
基于 rasx 的回答,这里有一个 PowerShell 函数,它假设您当前的文件已经以 UTF-8 编码(但可能带有 BOM),并将它们转换为不带 BOM 的 UTF-8,从而保留现有的 Unicode 字符。
Function Write-Utf8([string] $path, [string] $filter='*')
{
[IO.SearchOption] $option = [IO.SearchOption]::AllDirectories;
[String[]] $files = [IO.Directory]::GetFiles((Get-Item $path).FullName, $filter, $option);
foreach($file in $files)
{
"Writing $file...";
[String]$s = [IO.File]::ReadAllText($file, [Text.Encoding]::UTF8);
[Text.Encoding]$e = New-Object -TypeName Text.UTF8Encoding -ArgumentList ($false);
[IO.File]::WriteAllText($file, $s, $e);
}
}
将解决方案从 VS2008 转换为 VS2015 后遇到编码问题。转换后,所有项目文件都以 ANSI 编码,但它们包含 UTF8 内容,并在 VS2015 中被识别为 ANSI 文件。尝试了很多转换策略,但只有这个解决方案有效。
Encoding encoding = Encoding.Default;
String original = String.Empty;
foreach (var f in new DirectoryInfo(path).GetFiles("*.cs", SearchOption.AllDirectories))
{
using (StreamReader sr = new StreamReader(f.FullName, Encoding.Default))
{
original = sr.ReadToEnd();
encoding = sr.CurrentEncoding;
sr.Close();
}
if (encoding == Encoding.UTF8)
continue;
byte[] encBytes = encoding.GetBytes(original);
byte[] utf8Bytes = Encoding.Convert(encoding, Encoding.UTF8, encBytes);
var utf8Text = Encoding.UTF8.GetString(utf8Bytes);
File.WriteAllText(f.FullName, utf8Text, Encoding.UTF8);
}
该项目已从 Visual Studio 2017 的菜单中删除 您仍然可以通过“文件”->“另存为”-> 然后单击“保存”按钮上的向下箭头并单击“使用编码保存...”来访问该功能。
如果需要,您还可以通过“工具”->“自定义”->“命令”将其添加回“文件”菜单。
现在最好的解决方案是添加到
.editorconfig
文件中的 [*.cs]
(或任何你想要的格式)部分:
charset = utf-8
例如,我的
.editorconfig
开头为:
[*.cs]
charset = utf-8
如果需要,您也可以使用
utf-8-bom
。
接下来是在包含解决方案文件的文件夹中运行dotnet format命令,它将完成这项工作。
完成!
我只是提供此建议,以防万一无法在 Visual Studio 中自动执行此操作(我什至不确定这是否有效):