utf-8 相关问题

UTF-8是一种字符编码,它使用一到四个字节的字节序列来描述每个Unicode代码点。它向后兼容ASCII,同时仍支持所有Unicode代码点的表示。

浏览器的行为UTF-8页面带有额外字符,如U+FFFE(ajax错误)XML解析错误:格式不正确

我们正在使用 PrimeFaces 开发一些 JSF Web 应用程序。 可以在 inputText 中复制/粘贴带有非 UTF-8 字符(例如 ``(这是该字符))的文本并保存页面。但我...

回答 1 投票 0

可以自动将 Excel 输出保存为 unicode

我已将 Excel 表格从 Office 脚本返回到 Power Automation。但是当我将文件另存为txt文件时。 Notepad++ 检测文件为 UTF-8 是否可以复制Excel的“保存...

回答 1 投票 0

将 std::string 转换为 QString

我有一个 std::string 内容,我知道它包含 UTF-8 数据。我想将它转换为 QString。我该如何做到这一点,避免 Qt 中的 from-ASCII 转换?

回答 4 投票 0

如何通过在字符串中使用 \u 或 \U 转义来正确表示 python3 (3.6.1+) 中的补充 unicode 字符

最近我在学习python,遇到了python 3中unicode转义文字的问题。 似乎和 Java 一样,\u 转义符被解释为 Java 使用的 UTF-16 代码点,但是 h...

回答 1 投票 0

插入表情符号不适用于 spring-boot 和 MariaDB

我想在 mariaDB 数据库中插入像 😃 这样的表情符号,但我总是收到 sql 错误。 这是堆栈跟踪: 12-01-2018 16:01:44.466 [执行器 - 迁移 - 1] 警告 o.h.e.jdbc.spi.SqlException...

回答 4 投票 0

Rest 模板返回乱码某种中文的响应

我正在使用rest模板调用API,当我使用rest模板调用API时,它返回一些乱码,例如中文。 ResponseEntity 响应=restTemplate.exchange(url, meth...

回答 1 投票 0

有Unreal C++函数可以将字节数组解析为具有特定编码的FString吗?

我正在开发一个虚幻引擎5项目,我需要解析二进制文件。这些文件包含以 Shift-JIS 编码的文本,而不是 UTF-8 编码。我的目标是将字节数组从 t 转换...

回答 1 投票 0

C++ 中 std::filesystem::path 转换为 std::string 的问题

我在尝试从目录中获取所有文件名时遇到问题。处理某些字符串时会出现问题,导致错误。下面是代码片段: #包括 我在尝试从目录中获取所有文件名时遇到问题。处理某些字符串时会出现问题,导致错误。下面是代码片段: #include <filesystem> int main() { const char* dir = "D:\\Music"; std::vector<std::string> musicList; for (const auto& entry : std::filesystem::recursive_directory_iterator(dir)) { if (entry.is_regular_file()) { musicList.emplace_back(entry.path().string()); } } } 在处理 L"D:\Music\suki\Angel Note - 月明かりは优しく・・・.mp3" 等字符串时,该问题出现在entry.path().string()处。程序终止并出现错误,指向: _STD_BEGIN // We would really love to use the proper way of building error_code by specializing // is_error_code_enum and make_error_code for __std_win_error, but because: // 1. We would like to keep the definition of __std_win_error in xfilesystem_abi.h // 2. and xfilesystem_abi.h cannot include <system_error> // 3. and specialization of is_error_code_enum and overload of make_error_code // need to be kept together with the enum (see limerick in N4950 [temp.expl.spec]/8) // we resort to using this _Make_ec helper. _NODISCARD inline error_code _Make_ec(__std_win_error _Errno) noexcept { // make an error_code return { static_cast<int>(_Errno), _STD system_category() }; } [[noreturn]] inline void _Throw_system_error_from_std_win_error(const __std_win_error _Errno) { _THROW(system_error{ _Make_ec(_Errno) }); // Here occur error! } _STD_END 哦,我是在vs2022中编译的代码,c++标准是17。 经过调查,我将问题简化为: #include <filesystem> int main() { std::filesystem::path path = L"・"; auto str = path.string(); } path.string() 也出现了类似的问题。使用 L"\u30FB" 进一步简化后,我发现字符 ・ 表示为“\u30FB”。 虽然 path.wstring()、path.u8string() 和其他字符串转换工作得很好,但我需要一个 char* 用于 API,例如 ImGui::Text(str) 或 FMOD 的 API。尝试使用 codecvt、Win32 API 或 ICU 将 wstring 转换为字符串会导致出现乱码文本,例如“ã»”: #include <filesystem> #include <Windows.h> std::string ws2s(const std::wstring& wstr) { int utf8Len = WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), -1, nullptr, 0, nullptr, nullptr); char* utf8String = new char[utf8Len]; WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), -1, utf8String, utf8Len, nullptr, nullptr); return utf8String; } int main() { std::filesystem::path path = L"\u30FB"; auto str = ws2s(path.wstring()); } 生成的 str 是“ãf»”而不是“\u30FB”。 有没有可靠的方法可以有效处理这种情况? 这是编码问题。将其添加到程序的开头,问题应该得到解决: const char* const localeName = "ja_JP.utf-8"; // instruct C standard library that Japanese will be used with UTF-8 encoding std::setlocale(LC_ALL, localeName); // instruct C++ standard library that Japanese will be used with UTF-8 encoding for example in std::string, std::ostream std::locale::global(std::locale(localeName)); // use system locale (language and encoding), when printing data to std::cout std::cout.imbue(std::locale{""}}); 我也遇到了类似的问题 boost::filesystem::path,这解决了问题。

回答 1 投票 0

python无法读取编码='utf8'的json文件

我无法使用此 json 文件读取全文: { “消息”:[ { "sender_name": "测试", “时间戳_ms”:1554347140802, “内容&q...

回答 1 投票 0

0x9d在什么8位字符集中有意义?

0x9d 在什么 8 位类似 ASCII 的英语字符集中有意义? 我正在清理一些旧的数据文件,偶尔会在其他 ASCII 文本中找到 0x9d。 (不,这不是 UTF-8。) 这不是...

回答 5 投票 0

使用 BOM 来处理 UTF-8 文件的正确方法是什么?

我想将多个 UTF-8 文本文件合并在一起,而文件中间不包含多个 BOM。 除了从每个文件中剥离 BOM 之外,还有其他正确的方法吗? 我的问题是...

回答 2 投票 0

如何在windows下的cmd窗口中显示日文汉字?

我有一个英文版 Windows 2003 服务器,并激活了亚洲语言支持。命令窗口(cmd 设置)仅有的两种可用字体是 raster 和 lucida console。既不是一个也不是...

回答 5 投票 0

UTF-8 字符无法正确显示

我正在尝试用 PHP 回显一些 utf-8 字符。但它们没有正确显示。 这是 PHP 代码。 还有,我

回答 2 投票 0

DB2 UTF8 存储配置

我有DB2数据库,并且我已经用varchar(x)定义了表,但似乎x - 不是字符数而是字节数。是否有可能以某种方式动态解决该问题...

回答 1 投票 0

尝试从 Spring Boot 应用程序检索数据时出现数据库 UTF-8 编码问题

我的Oracle数据库不支持utf-8编码,但是某些表列值仍然由utf-8字符组成。它是使用 N 文本文字插入的。所以我的目标是能够过滤这些...

回答 1 投票 0

JS 中使用 UTF8 字符的正则表达式自动换行

我已经阅读了这里涉及类似问题的所有文章,但仍然没有找到任何解决方案。就我而言,我想用跨度包裹字符串的每个单词。这些词包含特定...

回答 1 投票 0

如何解码unicode字符串

我有这个字符串我想解码: “\u00d0\u00a1\u00d1\u0080\u00d0\u00b5\u00d0\u00b4\u00d0\u00bd\u00d0\u00b8\u00d0\u00b9\u00d1\u0087\u00d0\u00b5\u00d0\u00ba 20 00\u00c2\u00e2\u0082\u00bd&

回答 1 投票 0

如何在redis HMSET中保存非Ascii字符?

我想将阿拉伯字符(例如 กกรรรร)保存在 Redis 哈希中,如下所示: HMSET 阿拉伯语散列“Sham”5 好的 但结果并不如预期: 127.0.0.1:6379> HGETALL 阿拉伯语哈希 1) “\xd8\xb3\xd9\x8...

回答 2 投票 0

multipart/form-data HTTP POST 请求中如何指定字符编码?

HTML 5 规范描述了一种用于选择多部分表单提交中使用的字符编码(例如 UTF-8)的算法。然而,目前尚不清楚所选编码应如何...

回答 1 投票 0

将普通字母转换为宽字符

perl如何将半角形式转换为全角形式?用perl的术语来说,就是从普通字符到宽字符。 例如,来自 !abc ABC!到!abcABC! 从算术上看,以下应该是正确的

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.