unicode 相关问题

Unicode是文本编码,表示和处理的标准,旨在支持包含所有书写系统,技术符号和标点符号的书面文本所需的所有字符。

为什么我在 LaTeX 中无法显示 ð 符号?

我可以使用 \DeclareUnicodeCharacter{0278}{\phi} 然后使用 $ɸ$ 在 LaTeX 中显示 ɸ 符号。但是,当我尝试使用时: \usepackage[utf8]{inputenc} \DeclareUnicodeCharacter{0360}{ 个} 伊金{

回答 2 投票 0

Unicode (HTML) 用于数字上的抑扬符?

要在前面的字符上添加扬抑符,即“帽子”(^),我们可以使用 Unicode U+0302、组合抑扬符或 HTML 中的 ̂,例如ŝ 给出 ŝ ("s hat&qu...

回答 1 投票 0

是否有引号符号没有浮在基线之上?

在检查我的网页时,我发现引号“、”或我尝试找到的任何其他变体,例如“或”all,如您所料,有一个很大的空白...

回答 4 投票 0

BMP 之外的 JavaScript 字符串

BMP 是基本多语言平面 根据 JavaScript:好的部分: JavaScript 是在 Unicode 是 16 位字符集的时候构建的,因此 JavaScript 中的所有字符都是 16 位 w...

回答 5 投票 0

主机名中的日语为 http:// URL 主机名 - 只需编码 UTF8 字节,或者也编码 punycode?

客户的主机名中包含日语字符(系统区域设置为 ja_JP.UTF-8)。 我现在必须编写一个 ISO C 函数,它接受该主机名并将其转换为 URL。我是否必须通过...进行编码

回答 1 投票 0

动态unicode消息内容

我的邮件正文是动态的,有时包含撇号(`)。例如:Swifty 的汽车 消息未在接收方手机“Swiftya 的汽车”上正确显示 我怎样才能解决这个问题?我...

回答 1 投票 0

在 JavaScript 中,有没有办法迭代字符串的词汇标记?

鉴于我从端点收到的这个字符串: “\u0000\u0000\u0000\u001A% 鉴于我从端点收到的这个字符串: "\u0000\u0000\u0000\u001A%<some-random-text\fcdtoolHxxx1-34e3-4069-b97c-xxxxxxxxxxx\u001E\n" 我想迭代字符串以转义以 \u 开头的每个序列。结果字符串将是: "\\u0000\\u0000\\u0000\\u001A%<some-random-text\fcdtoolHxxx1-34e3-4069-b97c-xxxxxxxxxxx\\u001E\n" 注意 \f 和 \n 没有被转义。那么,我怎样才能只转义那些 \u 序列呢? 使用像这样的正则表达式是行不通的,因为序列 \f 和 \n 也会被替换,但它们应该保持不变。 function escapeUnicode(str: string) { return s.replace(/[\u0000-\u001F]/gu, function (chr) { return "\\u" + ("0000" + chr.charCodeAt(0).toString(16)).slice(-4); }); } 有String.raw,但除非您将字符串作为文字传递,否则它将不起作用。例如,在下面的代码中,我可以将其用作文字: let s = String.raw`\u0000\u0000\u0000\u001A%<deployment-deploymentStepStart\fcdtoolHb3dccc41-8cf0-4069`; var escaped = String.raw``; for (let i = 0, j = i + 1; i < s.length - 1; i++,j=i+1) { let curChar = String.fromCharCode(s.charCodeAt(i)); let nextChar = String.fromCharCode(s.charCodeAt(j)); if (curChar === "\\" && nextChar === "u") { escaped += String.raw`\\u`; i++; } else { escaped += curChar; } } escaped += String.fromCharCode(s.charCodeAt(s.length - 1)); console.log(escaped); 但正如我上面提到的,文本来自端点,因此如果我们将其存储在变量中,然后尝试执行相同的 for 循环,它将不起作用。 let someVariable = "\u0000\u0000\u0000\u001A%<deployment-deploymentStepStart\fcdtoolHb3dccc41-8cf0-4069" let s = String.raw({raw: someVariable}); // ... rest of the code above 您可以使用 JSON.stringify 来实现这一点: var examplestring = `\u0000\u0000\u0000\u001A%<some-random-text\fcdtoolHxxx1-34e3-4069-b97c-xxxxxxxxxxx\u001E\n` //basic example console.log(examplestring) console.log(JSON.stringify(examplestring)) console.log(JSON.stringify(examplestring).replaceAll('\\u','\\\\u')) //using your example code: var s = JSON.stringify(examplestring); var escaped = String.raw``; for (let i = 0, j = i + 1; i < s.length - 1; i++,j=i+1) { let curChar = String.fromCharCode(s.charCodeAt(i)); let nextChar = String.fromCharCode(s.charCodeAt(j)); if (curChar === "\\" && nextChar === "u") { escaped += String.raw`\\u`; i++; } else { escaped += curChar; } } escaped += String.fromCharCode(s.charCodeAt(s.length - 1)); console.log(escaped); 这是 String.raw 的更简单的正则表达式 const escapeUnicode = (str) =>str.replace(/\u([\da-fA-F]{4})/g, (match, grp) => `\\u${grp}`) console.log(escapeUnicode(String.raw`\u0000\u0000\u0000\u001A%<some-random-text\fcdtoolHxxx1-34e3-4069-b97c-xxxxxxxxxxx\u001E\n`))

回答 2 投票 0

在 HTML 中显示 unicode 符号

我想简单地在 HTML 页面中显示勾号 (✔) 和叉号 (✘) 符号,但它显示为一个框或粘稠的 ✠- 显然与编码有关。 我已将元标记设置为...

回答 6 投票 0

Google 电子表格正则表达式 - 用拉丁字符分隔名字

我在 Google 电子表格中有一个包含全名的列。它看起来像这样: 全名 阿卡西奥·贝尔纳多 卡洛斯·莫赖斯 安德烈·达席尔瓦 我需要让它看起来像这样: 全名首先...

回答 1 投票 0

从文本文件编码表情符号(Python)的最佳和干净的方法

参考了这个问题:Emoji crashed while uploading to Big Query 我正在寻找最好、最干净的方法来将表情符号从 \ud83d\ude04 类型编码为这个(Unicode) - \U0001f604 因为

回答 2 投票 0

使用chardet检测编码

我已经得到了文件的编码,但是编码还是有错误。我不知道如何解决这个问题。有人可以帮我吗? 代码: 将 pandas 导入为 pd 导入 numpy a...

回答 2 投票 0

从 PHP 中的字符串中删除“\u00a0”

我从数据库字符串中收到了一些特殊字符,例如 \u00a0 这会导致输出中出现大量空行。我知道这些字符是特殊字符 NO-BREAK SPACE'(U...

回答 1 投票 0

OS X - 如何计算标准化文件名

我需要在 Windows 和 OS X 上生成的文件名之间创建映射。我知道 OS X“将所有文件名转换为分解的 Unicode”,但是“大多数卷格式并不遵循确切的

回答 3 投票 0

UTF-8 多字节和 bom

我读过这个很棒的教程 http://www.joelonsoftware.com/articles/Unicode.html 但我不明白UTF-8如何解决高端、低端机器的问题。 对于1byte来说,还可以。 对于多b...

回答 3 投票 0

尝试在 MacOS Sonoma 上的 C# Unity 游戏中读取文本文件:返回 INQUIRY 字符

我有一个 Unity 游戏,将内容存储在 json 文件中,并且 MacOS Sonoma 上的一个用户报告了游戏无法解析其系统上的文件的问题 - StreamReader 认为他们都

回答 1 投票 0

“ascii”编解码器无法对位置 10 中的字符“\xe9”进行编码:序号不在范围(128)中

我正在尝试用 python 编写一个带有 smtp 的程序,以便用它发送电子邮件,但它总是向我部署此错误 'ascii' 编解码器无法对位置 10 中的字符 '\xe9' 进行编码:序号不在 ra 中...

回答 2 投票 0

与 TrimmingCharacters 相反的 Swift String(在:CharacterSet 中)

在 Swift 中,有一个与 String.trimmingCharacters(in:CharacterSet) 相反/互补的东西,比如keepingCharacters(in:CharacterSet)。 而不是像

回答 1 投票 0

带有正则表达式的 grep 错误地选择了 unicode 字符

我使用以下正则表达式运行 grep : 猫文件.txt | grep -e "^[a-zA-Z]" 重点是只获取以 ascii 范围内的字母字符开头的行,如果我

回答 1 投票 0

如何从字体文件中删除字符?

我已经下载了 DejaVu 开源字体并希望将其用于 WebFont,但即使在转换它时,我也会得到一个大文件,而且因为我将使用的网站仅支持几种语言(阿拉伯语、

回答 2 投票 0

Win32 <tchar.h> TCHAR 转 UTF-8?

如何将 Win32 TCHAR 字符串从 转换为 UTF-8 字符串?我还没有找到任何文档如何做到这一点,只有 TCHAR 到多字节字符串 (wcstombs()),它依赖于 c...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.