我需要在 .NET Core 应用程序中获取 Windows 默认代码页。 IE。在英语系统上为 1252,在西里尔系统上为 1251,在希腊语系统上为 1253,等等。以前在 .NET Framework 4 和 Mono 中,它很容易通过 Encoding.Default 完成。程序迁移到.NET Core 3.1后,现在需要在每台PC上手动设置代码页码。这对一些用户来说并不容易。
如何返回遗留(系统)代码页的自动检测?无法读取 Windows 注册表来检测系统设置,因为该应用程序还应该在 Linux 上运行,并使用从 Windows PC 接收(或发送到)的外部数据。
其他使用ANSI代码页进行数据输入输出的软件无法改写
可能 OEM 代码页也很有趣(用于与控制台软件的无缝交互,它甚至仍然使用 DOS 代码页)。
第一个是 .NET Framework 代码,第二个是它的 .NET Core 等效代码:
//OutputEncoding = Encoding.Default;
OutputEncoding = CodePagesEncodingProvider.Instance.GetEncoding(System.Globalization.CultureInfo.CurrentCulture.TextInfo.ANSICodePage);
很长,但在 Windows 和 Linux 上都能正常工作。
DOS、EBCDIC 和 MacOS 编码可以通过
CurrentCulture.TextInfo.*CodePage
类似地获得。
我不同意 Alexander Tauenis 的回答。
System.Globalization.CultureInfo.CurrentCulture.TextInfo.ANSICodePage
仍将返回旧的 ANSI 代码页编号,即使用户启用了选项“Beta:使用 Unicode UTF-8 以获得全球语言支持”。在这种情况下,Encoding.Default
和CodePagesEncodingProvider.Instance.GetEncoding(System.Globalization.CultureInfo.CurrentCulture.TextInfo.ANSICodePage)
的行为是不同的。
在 .NET 中找到正确的代码页码并不容易。这是一个正确的方法(但不幸的是它调用了 Win32API)
在文件中
NativeMethods.cs
:
public partial class NativeMethods {
/// Return Type: UINT->unsigned int
[System.Runtime.InteropServices.DllImportAttribute("kernel32.dll", EntryPoint="GetACP")]
public static extern uint GetACP() ;
}
并获取代码页码:
var codepage = NativeMethods.GetACP()
更新:
调用
Encoding.RegisterProvider(CodePagesEncodingProvider.Instance)
然后Encoding.GetEncoding(0)
可以正确获取ANSI代码页和UTF-8机器正确返回UTF-8。见https://github.com/CnCNet/xna-cncnet-client/blob/7edcf349017963d1777181d79173f636368ad6c0/ClientCore/PlatformShim/EncodingExt.cs使用。