utf-8 相关问题

UTF-8是一种字符编码,它使用一到四个字节的字节序列来描述每个Unicode代码点。它向后兼容ASCII,同时仍支持所有Unicode代码点的表示。

如何在 python 3.6 中列出阿姆哈拉语(Unicode)代码点

我想要一个包含 utf-8 的阿姆哈拉语字母表的列表。字符范围是从 U+1200 到 U+1399。我正在使用 Windows 8。我遇到了 SyntaxError: (unicode error) 'unicodeescape' codec can't de...

回答 3 投票 0

特殊字符未在文本框中正确显示

我使用 PHP + HTML + smarty (作为模板)。 有一些来自用户输入的动态内容。 当用户输入一些特殊字符,例如 —.‘@• 时,它已正确保存在变量中...

回答 2 投票 0

MySQL导入csv表时UTF8字符串无效

我想通过以下方式将 .csv 文件导入 MySQL 数据库: 加载数据本地文件'C:\Users\t_lichtenberger\Desktop\tblEnvironmentLog.csv' 进入表 tblenvironmentlog 字符集utf8 领域

回答 5 投票 0

如何将长字符串插入到 UTF8 排序的 varchar(N) 列中?

我在 VARCHAR(MAX) 源中有数据,我需要将其作为 VARCHAR(N) 插入到另一个表中。 我需要使用的排序规则是UTF8(特别是Czech_100_CI_AS_SC_UTF8)。 问题是,即使我剪了...

回答 1 投票 0

如何诊断字符编码问题

我无法识别似乎与 Postgres 数据库中存在的奇怪字符有关的问题。我使用 Java 从 Postgres 中提取数据并将其加载到 BigQuery 中。

回答 1 投票 0

有什么方法可以通过java程序告诉Excel以utf8打开csv文件吗?

我正在使用javacode将数据写入A.csv文件,然后读取A.csv文件并写入数据库。我有中文数据,但 Excel 无法正确识别,得到垃圾值。有没有...

回答 3 投票 0

批处理脚本注释中奇怪的编码问题

我在批处理脚本的标头中添加了 AGPL-3.0 许可证的声明(以 UTF-8 保存)。另外,为了方便中国开发者,我还在下面添加了中文翻译链接...

回答 1 投票 0

UTF-8 输入并使用 XGetICValues

我找到了 UTF-8 输入的示例(已接受的答案),但我想知道该示例是否正确。 XGetICValues 的结果可以传递给 XSelectInput: 无符号长掩码= 0; if (!XGetICValue...

回答 1 投票 0

确定Linux上的NLS_LANG

如何确定 Linux 上 Oracle 客户端的 NLS_LANG 设置? 我没有明确设置 NLS_LANG。 是否需要设置并导出变量 NLS_LANG=AMERICAN_AMERICA.AL32UTF8

回答 2 投票 0

在Python中将字节字符串解码为西里尔语

我有一个像这样的字节字符串,它应该是西里尔字符的Сравнение: a = b'Сравнение' 解码我...

回答 1 投票 0

将UTF-8转换为base64字符串

我正在尝试将UTF-8 转换为base64 字符串。 示例:我有 UTF-8 格式的“abcdef==”。它实际上是 Base64 字符串的“表示”。 如何检索“abcdef==”base64 字符串(请注意,我...

回答 2 投票 0

在AWS服务器的MySQL数据库中插入日语字符时出现字符编码问题

我遇到这个问题,在 mysql 数据库中插入日语字符时不会插入正确的编码字符。数据库已设置为 utf8mb4_general_ci。 Html已经...

回答 1 投票 0

使用 Flask 的 jsonify 将 é 显示为 é

jsonify('é') 没有打印出我期望的内容。我看到的不是 é,而是 é。 应用程序=烧瓶(__名称__) app.config['JSON_AS_ASCII'] = False @app.route('/') 定义测试(): 返回 jsonify('é')

回答 2 投票 0

如何在最近使用 UTF-8 语言环境的 macOS 中处理 toupper() 返回的大于 255 的值

下面的代码试图解决的问题是如何有效地检测可能正在使用基于 UTF-8 的语言环境,以便不会查询 127 以上的所有代码点的 ctype 属性,...

回答 1 投票 0

使用 MSXML 以 UTF-8 格式保存 XML

我正在尝试加载一个简单的 Xml 文件(以 UTF-8 编码): 并将其用 MSXML 保存在 vbscript 中: 设置 xmlDoc = CreateObject("MSXML2.DOMDocum...

回答 4 投票 0

代理对是如何计算的?

如果 unicode 代码点使用 17 位或更多,则如何计算代理对?

回答 3 投票 0

解析 XML 文件时需要类似字节的对象,而不是“str”

我正在尝试解析如下所示的 xml。我想提取有关类别的信息,即 ID、家长 ID 等: 我正在尝试解析如下所示的 xml。我想提取有关类别的信息,即 ID、家长 ID 等: <?xml version="1.0" encoding="UTF-8"?> <test timestamp="20210113"> <kategorien> <kategorie id="1" parent_id="0"> Sprache </kategorie> </kategorien> </test> 我正在尝试这个 fields = ['id', 'parent_id'] with open('output.csv', 'wb') as fp: writer = csv.writer(fp) writer.writerow(fields) tree = ET.parse('./file.xml') # from your example Locations is the root and Location is the first level for elem in tree.getroot(): writer.writerow([(elem.get(name) or '').encode('utf-8') for name in fields]) 但我收到此错误: in <module> writer.writerow(fields) TypeError: a bytes-like object is required, not 'str' 即使我已经在代码中使用了encode('utf-8') 。我怎样才能摆脱这个错误? 编辑2 如果想查找嵌套属性或子类,有两种方法: 您可以使用嵌套循环: for elem in root: for child in elem: print([(child.attrib.get(name) or 'c') for name in fields]) 输出: ['1','0'] 在这里,它还可以返回具有 id 和 parent_id 但不包含名称 kategorie 的类。 如果您想以更高的性能和更少的内存来执行任务: for elem in root.iter('kategorie'): print([(elem.attrib.get(name) or 'c') for name in fields]) 输出: ['1','0'] 对于此方法,它将返回名为 kategorie 的每个类和子类。 编辑1:对于评论中的问题: <?xml version="1.0"?> <kategorien> <kategorie id="1" parent_id="0"> Sprache </kategorie> </kategorien> 对于上面的xml文件,代码似乎运行得很好: fields = ['id', 'parent_id'] for elem in tree.getroot(): print([(elem.attrib.get(name) or 'c') for name in fields]) 输出: ['1','0'] 原答案: 看起来您正在寻找错误的位置。错误实际上发生在 writer.writerow(fields) fields 是一个包含 str 而不是 byte 的列表,这就是它给你错误的原因。我建议您将写入类型从 wb 更改为 w,但看看其余的代码,看起来您想用 byte 写入。 writer.writerow([x.encode('utf-8') for x in fields]) encode() 只是将您的数据转换为 byte 形式。 我看到两个问题。首先,您不需要自己进行编码。打开不带“b”二进制标志的文件并跳过 .encode。文件对象将为您进行编码。您看到的错误来自包含未编码字符串的 ['id', 'parent_id'] 列表。但如果你一开始就不以二进制方式打开,那就不是问题。 其次,您迭代了错误的元素。在循环中添加 print(elem),您就会看到。相反,您可以使用 findall 和伪 xpath 来获取所需的元素。 import csv import xml.etree.ElementTree as ET fields = ['id', 'parent_id'] with open('output.csv', 'w') as fp: writer = csv.writer(fp) writer.writerow(fields) tree = ET.parse('./file.xml') # from your example Locations is the root and Location is the first level for elem in tree.getroot().findall('kategorien/kategorie'): writer.writerow([(elem.get(name) or '') for name in fields])

回答 2 投票 0

在 JSON 响应中设置与 UTF-8 不同的字符集

我在 ASP.NET Core 项目的控制器中有这个 get 请求 [http获取] [路线(“api/controller/getlastresult/{id}”)] 公共 IActionResult GetLatestResultForController(字符串 id) {

回答 1 投票 0

损坏的希伯来语:另存为 ansi - 隐蔽回 UTF-8

我怀疑某些数据已(在 Windows 机器上)保存为 ANSI。 因此,原来的希伯来字符丢失了,我们看到的是类似的东西 ùéôåãé äòéø。 信息是否丢失或者是否存在

回答 2 投票 0

UTF 8 字符无法正确加载

所以我有一个学校项目,要求您加载一个包含 utf8 字符(如“ł,ą,ż,ź,ć,...”)的文本文件,然后对该文本进行一些编辑。但问题是,如果你...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.