它们是不包含在UTF_8字符集中的任何字符吗

问题描述 投票:0回答:1

我正在尝试用java创建一个测试用例来测试

decoder.onMalformedInput(CodingErrorAction.REPLACE);
decoder.onUnmappableCharacter(CodingErrorAction.REPLACE);

我需要 UTF_8 字符集中的一些字符来测试它们。 (如果我从代码中删除这两行,那么它一定会给出一些错误)

我的java代码中需要一些字符来解决这个问题。

java utf-8 character-encoding encoder-decoder charset
1个回答
0
投票

未包含在 UTF_8 字符集中

您正在混淆两种不同的事物:

  • 字符集是字符的集合,每个字符都由一个称为“代码点”的指定数字进行标识。该集合可能包含单一人类语言或多种人类语言的字符。 字符编码是一种通过记录分配的数字的位和字节来表示特定字符集的某些文本的方法。
  • UTF-8 是一种字符编码,使用一个或多个八位位组来表示每个分配的数字。 UTF-8 可以表示 Unicode 识别的超过一百万个分配的数字中的任何一个。在统一码中,

© www.soinside.com 2019 - 2024. All rights reserved.