character-encoding 相关问题

字符编码是指字符表示为一系列字节的方式。 Web的字符编码在编码标准中定义,网址为https://encoding.spec.whatwg.org/

如何在android中检查字符串是明文还是base64格式

我想检查 Android 应用程序中的字符串是否采用 Base64 编码格式。如果它是 Base64 格式的,那么我需要对其进行解码并在解码后显示内容。我已经使用了Base 64的答案

回答 2 投票 0

这是捷克语的罕见字符编码吗?

我最近在多个文件中下载了千兆字节的数据(文本),我想自动处理这些文件。但是,文本的字符集或实际编码是错误的。问题是文本编辑器成功...

回答 2 投票 0

将 Visual Studio 项目中的所有文件保存为 UTF-8

我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们全部相同(UTF-8 与

回答 14 投票 0

使用 PHP 在 CLI/shell/终端中打印表情符号/外来字符

当我在终端中运行包含 的脚本时 当我在包含 <?php echo "🚀पीएचपी"; 的终端中运行脚本时,它显示垃圾字符而不是表情符号和外文文本。 具体来说,它显示≡ƒÜÇαñ¬αÑÇαñÅαñÜαñ¬αÑÇ。 但是,运行包含 console.log("🚀पीएचपी") 的 Node.js 脚本会正确地将表情符号和外文文本显示为 🚀पीएचपी。 如何在使用 PHP 时正确回显/打印表情符号和外文文本,以便它们按预期在 CLI 中显示? 我已尝试将默认字符集设置为 UTF-8 ini_set('default_charset', 'UTF-8');,但我仍然看到垃圾字符而不是预期的输出。关于如何解决此问题并让 PHP 在终端中正确显示表情符号和 unicode 文本有什么建议吗? 编辑: 此场景已使用 Windows 终端 (Powershell 7)、cmd 和 GitBash(MINGW64) 终端进行了测试 更新: 测试脚本: <?php $utf8_string = "Hello, 🚀पीएचपी"; $detected_encoding = mb_detect_encoding($utf8_string); echo "Detected encoding[$utf8_string]: " . $detected_encoding; 输出: Detected encoding[Hello, ≡ƒÜÇαñ¬αÑÇαñÅαñÜαñ¬αÑÇ]: UTF-8 您看到的问题可能与终端的编码设置有关,而不是与 PHP 本身有关。您的终端需要支持并设置为使用 UTF-8 才能正确显示表情符号和外文文本。 mb_detect_encoding 函数正在检测字符串的编码为 UTF-8,这是正确的。 要验证 PHP 是否正确处理 UTF-8 编码的字符串,您可以将该字符串写入文件,然后在您知道支持 UTF-8 的文本编辑器中打开该文件。如果文本在文本编辑器中正确显示,则 PHP 正在正确处理 UTF-8 编码,问题可能出在您的终端设置上。

回答 1 投票 0

已经使用 utf8mb4 但得到 1366: 错误的字符串值: '\xF0\x9F\x98\x81\xF0\x9F...'

“字符串值不正确”问题的所有答案都指向使用 utf8mb4。但是,我仍在使用它,我仍然收到该错误。 跑步 选择 CCSA.character_set_name, collation_name FROM

回答 2 投票 0

从 std::wcin 检索有效的系统编码字符串

最近我面临着从用户读取非 ASCII 字符的需要。我怀疑这在处理文件时相对容易,但我对此并不满意。我想同时支持...

回答 1 投票 0

将 C# 字符串转换为流

要将字符串转换为流,代码通常是: byte[] byteArray = System.Text.Encoding.ASCII.GetBytes(inputString); MemoryStream 流 = new MemoryStream(byteArray); 这其中的关键是...

回答 1 投票 0

如何在 RDS Oracle 数据库上将字符集 (NLS_CHARACTERSET) 和国家字符集 (NLS_NCHAR_CHARACTERSET) 更改为 UTF8?

我们的应用程序设计为与字符集 (NLS_CHARACTERSET) 和国家字符集 (NLS_NCHAR_CHARACTERSET) 均设置为 UTF8 的 Oracle 11g 数据库配合使用。 在推出 Oracle 数据库时...

回答 3 投票 0

golang 将 iso8859-1 转换为 utf8

我正在尝试将 ISO 8859-1 编码字符串转换为 UTF-8。 以下函数适用于我的包含德语元音变音的测试数据,但我不太确定 rune(b) c 的编码源是什么...

回答 3 投票 0

这个字符是什么意思以及如何解码这些类型的字符?

我收到一个带有一些特殊字符的 xml,例如这些 Pre‿charged ‿,当我解析此数据时,我无法解析。在我的 xml 中,我正在获取 Prex**E2x80?**已充电或已预充电...

回答 0 投票 0

如何转换这些奇怪的字符? (�, �, �, �, �)

我的页面经常显示诸如 Ë、Ë、Þ、Ï、Ë 之类的内容来代替普通字符。 我使用 utf8 作为标题页和 MySQL 编码。这是怎么发生的?

回答 4 投票 0

R:用 unicode 代码替换非 ascii 字符[重复]

我需要将“č”、“š”、“ž”等特殊字符替换为它们的 unicode 等效字符(原因是由于

回答 2 投票 0

英特尔电话输入错误:无效的正则表达式

我使用国际电话输入插件进行号码验证,当我在本地设置它时它工作正常,但是当我将其上传到我的主机时,它给了我下图中链接的错误 “未捕获的 Synta...

回答 0 投票 0

如何在字符串开头添加@符号[关闭]

如何将 @ 符号添加到字符串的开头,以便字符串按以下方式解释 字符串 inputString = "\u0002;E "; 字符串 outputString = @...

回答 0 投票 0

如何解决 XAMPP MySQL 服务器中的土耳其字符编码问题?

Mysql土耳其语字符问题 我使用 xampp mysql 服务器作为服务器。 但我正在尝试从终端/cmd 使用它。 当我用像“oğuz”这样的土耳其字母查询 smth 时,它返回 &qu...

回答 0 投票 0

Windows 10 CLI 终端中的“git log”输出编码问题

问题 如何使 git log 命令输出正确显示在 Windows CLI 终端中? 例子 如您所见,我可以正确输入变音字符,但在 git log 上,输出不知何故

回答 7 投票 0

当密码包含特殊字符时写入连接字符串

我正在为一个 Python 项目使用 SQLalchemy,我希望有一个整洁的连接字符串来访问我的数据库。例如: engine = create_engine('postgresql://user:pass@host/database') 亲...

回答 3 投票 0

’ 被显示而不是 -

’ 正在显示而不是 - 在 php 页面中 我尝试使用不同的编码类型,例如: 和 ’ 在 php 页面中显示而不是 - 我尝试使用不同的编码类型,例如: <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"/> 和 <meta http-equiv="Content-Type" content="text/html; charset=utf-8"/> 但结果是一样的。可能是什么问题呢? 输入 <strong style="color:#A8A8A8;">1</strong> – Lorem Ipsum. 结果 1 – €“Lorem Ipsum. 确保您的 html 标题指定 utf8 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 这通常对我有用(很明显,如果内容是 utf8)。 如果设置了内容类型,则不需要转换为 html 实体。 检查http://php.net/manual/en/function.mb-convert-encoding.php <?php header('Content-Type: text/html; charset=utf-8'); mb_internal_encoding('utf-8'); ?> 也许这会对你有所帮助。 看起来您的源数据在此过程中从一种编码转换为另一种编码。尝试确保所有步骤都具有相同的编码。 您的(MySQL?)数据是否存储为 UTF8? 您的 .php 文件是否保存为 UTF8? 像这样的转换错误通常在将 UTF8 数据作为 ISO-8859-1 数据处理时弹出。 (多字节还是单字节?不确定)。 meta 标签没有改变输出的事实是一个强有力的指标,表明有一些东西覆盖了它;可能是 HTTP 标头中指定的字符集(优先于元标记),你确定你没有在那里设置它吗? 您的文档很可能是用 UTF-8 编码的,因为– 是 UTF-8 编码字符 –. 的 iso-8859-1 表示 你需要的是你描述的元标签: <meta http-equiv="Content-Type" content="text/html;charset=utf-8"> 因为它不起作用,标签可能会被忽略。建议使用浏览器并检查它尝试使用的编码(工具 - Chrome 中的编码)。 如果浏览器使用UTF-8,你已经对字符进行了双重编码。检查你的代码,如果你没有过多的utf8_encode(...) 如果浏览器使用 Latin1 (iso-8859-1),您的标签将被 HTTP 标头忽略或覆盖。尝试使用在线验证器验证您的 HTML。使用浏览器的开发工具检查发送的标头信息,确保未将 iso-8859-1 设置为编码。 从 javacode 创建文件并将编码设置为 UTF-16 时遇到同样的问题。 添加以下标题标签: <meta charset="UTF-8">

回答 6 投票 0

有关读取泰语文本文件并将泰语文本插入数据库的问题

使用 Javascript 进行编码 泰语文本文件使用 ANSI 编码 在 SQL 中设置 Collation 是 utf8_unicode_ci 在插入数据库之前显示文本它可以像这样显示泰语บร...

回答 0 投票 0

为什么 Python 和 Java 在解码 GBK 时表现不同

这个问题与如何正确解码GB18030中的字节有关。 我想解码一个用 GBK 编码的字节数组,但发现 Python 和 Java 有时表现不同......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.