utf-8 相关问题

UTF-8是一种字符编码,它使用一到四个字节的字节序列来描述每个Unicode代码点。它向后兼容ASCII,同时仍支持所有Unicode代码点的表示。

如何循环遍历字符串并获取每个位置的字符(有些带有重音符号)且重音符号不分隔?

我必须获取字符串上每个字符的重音数量,因此我循环遍历 contenteditable= true 的 标签的文本字符,我无法比较一些重音 我必须获取字符串上每个字符的重音数量,因此我使用 <h2> 循环遍历 contenteditable= true 标签的文本字符,我无法将某些重音字符与中的字符进行比较重音数据库,因为它们被分为字符和重音,但其他一些重音字符被视为一个字符。 let Accents= { /*...*/ 'x': [ ["x", 0], ["́x́", 1], ["̂x̂", 2], ["ẍ", 2], ["̌x̌", 2], ["ẋ", 1], ["̧x̧", 1], // ["̱x̱", 1], ["̣x̣", 1], ["ᶍ", 2] ], /*...*/ } $("button").on("click", function(){ text= $(".text").text() for(e in text){ console.log(text[e]) } }) <script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script> <h2 class= "text" contenteditable= "true">Lorem Ipx́um ẋ</h2> <button>Log each character</button> 如何才能像 x́一样在日志上获得 ẋ?,我需要这样做才能与口音数据库中的字符进行比较。预先感谢 在 Javascript 中,一些 Unicode 字符使用两个代码单元表示,特别是那些带有组合标记的代码单元,例如“x”后跟其重音符号。这些被称为“代理对”。要正确处理此类字符,您可以使用 JavaScript String.prototype[Symbol.iterator] 或带有数组的扩展运算符。 以下是如何修改代码以正确循环每个字素簇(包括基本字符及其组合标记): let Accents = { /*...*/ 'x': [ ["x", 0], ["́x́", 1], ["̂x̂", 2], ["ẍ", 2], ["̌x̌", 2], ["ẋ", 1], ["̧x̧", 1], // ["̱x̱", 1], ["̣x̣", 1], ["ᶍ", 2] ], /*...*/ } $("button").on("click", function(){ text = $(".text").text() // Use spread operator to break the string into individual grapheme clusters for(const char of [...text]){ console.log(char) } }); 现在,通过这种方法,x́ 和 ẋ 都将被视为循环中的单个字符。这将使您能够准确地将它们与口音数据库中的条目进行比较。

回答 1 投票 0

如何在 Windows 上将 UTF-8 字符串打印到 std::cout?

我正在用 C++ 编写一个跨平台应用程序。所有字符串均在内部进行 UTF-8 编码。考虑以下简化代码: #包括 #包括 int main() { ...

回答 0 投票 0

Laravel:以 UTF-8 编码 JSON 响应

我想将 API 的 JSON 响应编码为 UTF-8,但每次我做出响应时我不想这样做: 返回响应()->json($res,200,['Content-type'=>'application/json;charset=...

回答 3 投票 0

cmd 中的 UTF-8 无点 i

我有一个用utf-8编码的R脚本。在Rstudio中运行时,土耳其语字符没有问题。但是,当我尝试从 cmd 运行它时,它会抛出错误: 列 ÜrünAç...

回答 2 投票 0

忽略 CSV 中的 UTF-8 解码错误

我有一个 CSV 文件(我无法控制)。这是连接多个 CSV 文件的结果。该文件的大部分内容都是 UTF-8,但其中一个文件的字段经过编码...

回答 2 投票 0

PHP mb_detect_encoding 不再可靠地检测 UTF-8

我最近从 PHP 7 切换到 PHP 8.2.7,并注意到 mb_detect_encoding 似乎不再可靠地工作。我正在做以下事情: mb_detect_encoding(file_get_contents('somefile.csv'), 'UT...

回答 1 投票 0

utf8 的 UnicodeDecodeError,即使文件肯定是 utf8 编码的

我有一个 Fedora 上名为 ORCA 的程序的输出文件,我正在将其读入 python (3.10)。它是一个编码为“UTF-8”的纯文本文件。我知道这是因为我检查了 file -i

回答 1 投票 0

在打开的 NamedPipeClientStream 上重新创建 UTF-8 StreamWriter 会导致服务器上出现额外的 BOM 字符

我有一个保持打开状态的 NamedPipeServerStream 和一个保持打开状态的 NamedPipeClientStream。 NamedPipeServerStream 有一个保持打开状态的 UTF-8 StreamReader。 NamedPipeClientStream 有一个 UT...

回答 1 投票 0

防止将 BOM 添加到 UTF-8 SecureCRT 会话记录文件中

SecureCRT 似乎会向所有会话记录文件添加 BOM,无论选择哪种字符编码。当使用UTF-8时,SecureCRT生成一个带BOM的UTF-8文件而不是一个简单的U...

回答 1 投票 0

在这种情况下是 preg_replace 还是 mb_ereg_replace?

我有这个正则表达式用于匹配 Unicode 中的空格: /^[\pZ\pC]+|[\pZ\pC]+$/u 我什至不确定它的作用,但它似乎有效。现在,在这种情况下,哪个函数更适用,为什么? $s...

回答 2 投票 0

让自定义迭代器在 Rust 中通过 &String 工作

我目前正在努力实现一个迭代器,它分割给定的字符串并将子字符串作为迭代器返回。对于特殊字符,它将仅返回特殊字符 o...

回答 1 投票 0

如何将ReadFile与wchar_t一起使用?

考虑以下两个函数,第一个函数使用 Windows API 函数 ReadFile() 和 CreateFileW(),而第二个函数使用 fopen() 和 fgetws(),读取非英文文本…

回答 2 投票 0

Chrome 灯塔报告在最佳实践部分返回“正确定义字符集”问题

我有一个 VueJs SPA 应用程序。一切正常。但是当我运行 chrome lighthouse 报告时,它返回正确定义字符集错误。事实上,我已经在我的index.html 文件中添加了字符集。 哈...

回答 2 投票 0

python获取unicode字符串大小

我有一个二进制文件。该文件包含一个 UTF-8 字符串。而且,保证这个字符串只是一个单词。 在python中,如何获取该字符串中的字母数量? 比方说,我

回答 1 投票 0

如何在 POST 后以正确的编码在 Flask 中返回 json

我正在烧瓶中编写一个网络应用程序。它从树莓派上的 MySQL 服务器获取一个表。 使用 Postman 进行初步测试 我在创建表时将MySQL Workbench中的编码设置为utf-8 bin。 ...

回答 2 投票 0

比较 UTF-8 字符串

我正在尝试比较两个字符串,比如 Émilie 和 Zoey。好吧,“E”位于“Z”之前,但在 ASCII 图表中,Z 位于 É 之前,因此正常的 if ( str1 > str2 ) 不起作用。 我尝试使用 if (strcmp(...

回答 4 投票 0

制表在一定长度的网格单元末尾插入一个空格

在学习 Python 时,我决定使用包含最流行表情符号的 Kaggle 数据集来尝试 Python 的 csv 模块。 这是一个小样本: 十六进制,排名,表情符号,年份,类别,子类别,...

回答 1 投票 0

从 TStream 输出中删除 UTF-8 BOM

我正在使用Delphi 11。我必须使用TStream对象编写一个没有BOM的UTF-8 .csv文件,但是使用TEncoding.UTF8会生成一个带有BOM的UTF-8文件,所以我尝试使用编码直接无

回答 1 投票 0

可以强制CMake/MSVC对没有BOM的源文件使用UTF-8编码吗? C4819

我们所有的源代码都是有效的 UTF-8,但是 Windows 上的一些用户无法构建它们,因为他们的系统配置为不同的编码。 源文件不加BOM,可以吗...

回答 4 投票 0

如何解决错误:#1977 - 无法将“utf8”字符 0xD8AD 转换为“latin1”

我正在 phpmyadmin 工作,其中名称列中有阿拉伯值,例如 کلء الرقيّة Ø1Ù„ÛŒ الØ1Ø2ÛŒØ2شوریï 我想将它们转换为正确的形式。 我尝试了这些查询,它

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.