utf-8 相关问题

UTF-8是一种字符编码,它使用一到四个字节的字节序列来描述每个Unicode代码点。它向后兼容ASCII,同时仍支持所有Unicode代码点的表示。

如何在 Cygwin 上的 sed 中处理 UTF-8 表情符号?

我见过很多关于 SED 中转义和替换特殊字符的主题,但没有一个对我有帮助。 我需要在文件上使用这个 sed 命令: sed -i "s/This[^\|]\+/& (酷) /...

回答 3 投票 0

Flask:UnicodeDecodeError:'utf-8'编解码器无法解码位置0中的字节0xff:无效的起始字节

我正在使用flask模块开发一个python项目。这不是我第一次使用它,但我仍然是一个新手。当我设置一个非常简单的文件时,出现了这个错误:

回答 1 投票 0

Cypresss 无法在浏览器启动时加载 UTF-16 网站

我在头块中使用元标记字符集作为 UTF-16 创建了网站 因此,如果我在 Chrome 上手动检查我的网站,数据加载正常,但是当尝试...

回答 1 投票 0

char8_t 和 char16_t 的大小是动态的吗?

这是我所知道的: “UTF-8 是一种用于电子通信的可变长度字符编码标准。” 同样,UTF-16 是一种可变长度字符编码。 这就是我的

回答 1 投票 0

如何解码三字节编码的字符串?

我一直在使用 pandas 数据帧,其中一列是字节编码的。我用 .decode('utf-8') 解码了一次,它适用于数据的主要部分,但有一些字符串,

回答 1 投票 0

如何在 Windows 终端应用程序(UWP)中将默认编码更改为 UTF-8

我正在使用使用 UTF-8 编码的文件,但我的默认编码是 EUC-KR(chcp 949),我想知道如何将 UTF-8 适配为我的终端的默认编码(自动全部...

回答 2 投票 0

从 Facebook 或 Instagram 下载 Json 文件但看起来不正确?

我从Facebook和Instagram下载了一些json文件,大部分都是聊天记录。 我发现每个非英文字符都是由这样的“HH”组成的。 (例如:\

回答 1 投票 0

JSF 中 GET 参数的 UTF-8 编码

我在 JSF 中有一个搜索表单,它是使用 RichFaces 4 自动完成组件以及以下 JSF 2 页面和 Java bean 实现的。我使用 Tomcat 6 和 7 来运行该应用程序。 ... 我在 JSF 中有一个搜索表单,它是使用 RichFaces 4 自动完成组件以及以下 JSF 2 页面和 Java bean 实现的。我使用 Tomcat 6 和 7 来运行该应用程序。 ... <h:commandButton value="#{msg.search}" styleClass="search-btn" action="#{autoCompletBean.doSearch}" /> ... 在 AutoCompleteBean 中 public String doSearch() { //some logic here return "/path/to/page/with/multiple_results?query=" + searchQuery + "&amp;faces-redirect=true"; } 只要“searchQuery”字符串中的所有内容都在 Latin-1 中,此方法就可以正常工作,如果在 Latin-1 之外,则此方法不起作用。 例如,搜索“bodø”将自动编码为“bod%F8”。然而,搜索“Kra Ðong”将不起作用,因为它无法编码“Д。 我现在尝试了几种不同的方法来解决这个问题,但都不起作用。 我尝试使用 URLEncode 对我自己的 searchQuery 进行编码,但这只会导致双重编码,因为 % 被编码为 %25。 我尝试使用 java.net.URI 来获取编码,但给出与 URLEncode 相同的结果。 我尝试在连接器中使用 URIEncoding="UTF-8" 在 Tomcat 中打开 UTF-8,但这只会使问题变得更糟,因为非 ASCII 字符根本不起作用。 所以我的问题是: 我可以更改 JSF 2 编码 GET 参数的方式吗? 如果我无法更改 JSF 2 编码 GET 参数的方式,我可以关闭编码并手动执行吗? 我在这里做了什么奇怪的事吗?这似乎应该是开箱即用的支持,但我找不到任何其他人有同样的问题。 我认为您遇到了 JSF 中的一个极端情况错误。查询字符串由 ExternalContext#encodeRedirectURL() 进行 URL 编码,它使用由 ExternalContext#getResponseCharacterEncoding() 获得的响应字符编码。然而,虽然 JSF 默认使用 UTF-8 作为响应字符编码,但这仅在实际渲染视图时设置,而不是在重定向响应时设置,因此响应字符编码仍然返回平台默认值 ISO-8859-1 这会导致您的字符使用这种错误的编码进行 URL 编码。 我已将其报告为问题 2440。同时,您最好的选择是事先自己明确设置响应字符编码。 FacesContext.getCurrentInstance().getExternalContext().setResponseCharacterEncoding("UTF-8"); 注意,这仍然要求容器本身使用相同的字符编码来解码请求URL,所以你当然需要在Tomcat的配置中设置URIEncoding="UTF-8"。这不会再弄乱字符,因为它们现在将是真正的 UTF-8。 HTTP URL 和标头接受的唯一字符编码是 US-ASCII,您需要对这些字符进行 URL 编码才能将它们发送回应用程序。在 Java 中执行此操作的最简单方法是: public String doSearch() { //some logic here String encodedSearchQuery = java.net.URLEncoder.encode( searchQuery, "UTF-8" ); return "/path/to/page/with/multiple_results?query=" + encodedSearchQuery + "&amp;faces-redirect=true"; } 然后它应该适用于您使用的任何角色。

回答 2 投票 0

使用 xslt 从 Excel 的 xml 文件中的 CRLF 输入创建 LF 输出时出现问题

我有一些 XML,我想将其转换为 Excel 将在表中打开的 XML。 但是,我的一些源数据使用字符串 表示 CRLF 并创建一个新行。 我明白...

回答 2 投票 0

替换 JSON 中的回车符 (CR) 或换行符 (LF)

我遇到了 JSON 的问题,我承认我对此知之甚少: 我有 UTF-8 编码文本,其格式为换行符和/或回车符,我将其打包在 FME 工作台中...

回答 1 投票 0

当我的用户名不是 ascii 时,如何使 System.Environment.GetEnvironmentVariable("USERNAME") UTF-8 兼容?

在我的 C# Windows 应用程序中,我从 System.Environment.GetEnvironmentVariable("USERNAME") 获取用户名,而我的系统帐户不是 ascii,因此在调试时我得到

回答 1 投票 0

当我的用户名不是 ascii 时,如何使 System.Environment.GetEnvironmentVariable("USERNAME") UTF-8 兼容?

在我的 C# Windows 应用程序中,我从 System.Environment.GetEnvironmentVariable("USERNAME") 获取用户名,而我的系统帐户不是 ascii,因此在调试时我得到

回答 1 投票 0

这是什么:ส็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็ ็็็็็็็็็็็็็็็็็็[重复]

可能的重复: 使用的字符编码是什么? 我遇见了这个角色[ส็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็็ ็็็็็็็็็็็็็็็]今天,这真的让我很困惑.. 当我把它写到某些页面时,它

回答 1 投票 0

AES 加密和解密未给出正确的结果

从 tmp_categorywise_salary_rpt LIMIT 1 中选择 AES_ENCRYPT('fmale', '2b7e151628aed2a6abf7158809cf4f3c'); 选择 CAST(AES_DECRYPT('þ*Ë(|¸R°¢8Ç©', '2b7e151628aed2a6abf7158809cf4f3c') 作为 UTF8) FROM

回答 1 投票 0

强制标准输出编码为UTF8

我正在寻找从我的 C# 项目中另一个应用程序的标准输出流中解析 UTF8 字符。使用默认方法,ANSI 频谱之外的字符在以下情况下会被损坏:

回答 2 投票 0

有效的完整 utf8 序列中的一个可打印 latin1 字符

我正在尝试使用 Golang 的 libpq 驱动程序将电子邮件地址插入到 Postgres 中。错误信息是 无法执行查询。 pq:编码中字节序列为 0xf0 0x9f 0x9a 0x80 的字符...

回答 1 投票 0

在控制台/InputStream中正确读取unicode字符

我有 2 个 Windows 应用程序,我想在其中测试读写 Unicode 字符。我知道其他 IPC 可能性,但我想了解为什么这种特殊情况不起作用...

回答 1 投票 0

错误(双)编码的 CSV 的反向传播

我有一个 CSV 文件,有人编码错误。 该文件是具有相应演员的电影的数据库。我下载它是为了练习一些所谓的培根数的编码。 看起来...

回答 1 投票 0

使用 JavaScript 设置字符集元标记

我想在这里追踪一个错误:https://github.com/OscarGodson/EpicEditor/issues/184#issuecomment-8805982 根据所有信息,这似乎是因为浏览器默认...

回答 4 投票 0

html 字符

由于 json;parse 模块,我正在尝试使用 Basex107 解析 json 文件。 我的文件显示一些带有 html 字符的值,例如“text”值中的这样: “订购”...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.