utf-8 相关问题

UTF-8是一种字符编码,它使用一到四个字节的字节序列来描述每个Unicode代码点。它向后兼容ASCII,同时仍支持所有Unicode代码点的表示。

UTF-8 输入并使用 XGetICValues

我找到了 UTF-8 输入的示例(已接受的答案),但我想知道该示例是否正确。 XGetICValues 的结果可以传递给 XSelectInput: 无符号长掩码= 0; if (!XGetICValue...

回答 1 投票 0

确定Linux上的NLS_LANG

如何确定 Linux 上 Oracle 客户端的 NLS_LANG 设置? 我没有明确设置 NLS_LANG。 是否需要设置并导出变量 NLS_LANG=AMERICAN_AMERICA.AL32UTF8

回答 2 投票 0

在Python中将字节字符串解码为西里尔语

我有一个像这样的字节字符串,它应该是西里尔字符的Сравнение: a = b'Сравнение' 解码我...

回答 1 投票 0

将UTF-8转换为base64字符串

我正在尝试将UTF-8 转换为base64 字符串。 示例:我有 UTF-8 格式的“abcdef==”。它实际上是 Base64 字符串的“表示”。 如何检索“abcdef==”base64 字符串(请注意,我...

回答 2 投票 0

在AWS服务器的MySQL数据库中插入日语字符时出现字符编码问题

我遇到这个问题,在 mysql 数据库中插入日语字符时不会插入正确的编码字符。数据库已设置为 utf8mb4_general_ci。 Html已经...

回答 1 投票 0

使用 Flask 的 jsonify 将 é 显示为 é

jsonify('é') 没有打印出我期望的内容。我看到的不是 é,而是 é。 应用程序=烧瓶(__名称__) app.config['JSON_AS_ASCII'] = False @app.route('/') 定义测试(): 返回 jsonify('é')

回答 2 投票 0

如何在最近使用 UTF-8 语言环境的 macOS 中处理 toupper() 返回的大于 255 的值

下面的代码试图解决的问题是如何有效地检测可能正在使用基于 UTF-8 的语言环境,以便不会查询 127 以上的所有代码点的 ctype 属性,...

回答 1 投票 0

使用 MSXML 以 UTF-8 格式保存 XML

我正在尝试加载一个简单的 Xml 文件(以 UTF-8 编码): 并将其用 MSXML 保存在 vbscript 中: 设置 xmlDoc = CreateObject("MSXML2.DOMDocum...

回答 4 投票 0

代理对是如何计算的?

如果 unicode 代码点使用 17 位或更多,则如何计算代理对?

回答 3 投票 0

解析 XML 文件时需要类似字节的对象,而不是“str”

我正在尝试解析如下所示的 xml。我想提取有关类别的信息,即 ID、家长 ID 等: 我正在尝试解析如下所示的 xml。我想提取有关类别的信息,即 ID、家长 ID 等: <?xml version="1.0" encoding="UTF-8"?> <test timestamp="20210113"> <kategorien> <kategorie id="1" parent_id="0"> Sprache </kategorie> </kategorien> </test> 我正在尝试这个 fields = ['id', 'parent_id'] with open('output.csv', 'wb') as fp: writer = csv.writer(fp) writer.writerow(fields) tree = ET.parse('./file.xml') # from your example Locations is the root and Location is the first level for elem in tree.getroot(): writer.writerow([(elem.get(name) or '').encode('utf-8') for name in fields]) 但我收到此错误: in <module> writer.writerow(fields) TypeError: a bytes-like object is required, not 'str' 即使我已经在代码中使用了encode('utf-8') 。我怎样才能摆脱这个错误? 编辑2 如果想查找嵌套属性或子类,有两种方法: 您可以使用嵌套循环: for elem in root: for child in elem: print([(child.attrib.get(name) or 'c') for name in fields]) 输出: ['1','0'] 在这里,它还可以返回具有 id 和 parent_id 但不包含名称 kategorie 的类。 如果您想以更高的性能和更少的内存来执行任务: for elem in root.iter('kategorie'): print([(elem.attrib.get(name) or 'c') for name in fields]) 输出: ['1','0'] 对于此方法,它将返回名为 kategorie 的每个类和子类。 编辑1:对于评论中的问题: <?xml version="1.0"?> <kategorien> <kategorie id="1" parent_id="0"> Sprache </kategorie> </kategorien> 对于上面的xml文件,代码似乎运行得很好: fields = ['id', 'parent_id'] for elem in tree.getroot(): print([(elem.attrib.get(name) or 'c') for name in fields]) 输出: ['1','0'] 原答案: 看起来您正在寻找错误的位置。错误实际上发生在 writer.writerow(fields) fields 是一个包含 str 而不是 byte 的列表,这就是它给你错误的原因。我建议您将写入类型从 wb 更改为 w,但看看其余的代码,看起来您想用 byte 写入。 writer.writerow([x.encode('utf-8') for x in fields]) encode() 只是将您的数据转换为 byte 形式。 我看到两个问题。首先,您不需要自己进行编码。打开不带“b”二进制标志的文件并跳过 .encode。文件对象将为您进行编码。您看到的错误来自包含未编码字符串的 ['id', 'parent_id'] 列表。但如果你一开始就不以二进制方式打开,那就不是问题。 其次,您迭代了错误的元素。在循环中添加 print(elem),您就会看到。相反,您可以使用 findall 和伪 xpath 来获取所需的元素。 import csv import xml.etree.ElementTree as ET fields = ['id', 'parent_id'] with open('output.csv', 'w') as fp: writer = csv.writer(fp) writer.writerow(fields) tree = ET.parse('./file.xml') # from your example Locations is the root and Location is the first level for elem in tree.getroot().findall('kategorien/kategorie'): writer.writerow([(elem.get(name) or '') for name in fields])

回答 2 投票 0

在 JSON 响应中设置与 UTF-8 不同的字符集

我在 ASP.NET Core 项目的控制器中有这个 get 请求 [http获取] [路线(“api/controller/getlastresult/{id}”)] 公共 IActionResult GetLatestResultForController(字符串 id) {

回答 1 投票 0

损坏的希伯来语:另存为 ansi - 隐蔽回 UTF-8

我怀疑某些数据已(在 Windows 机器上)保存为 ANSI。 因此,原来的希伯来字符丢失了,我们看到的是类似的东西 ùéôåãé äòéø。 信息是否丢失或者是否存在

回答 2 投票 0

UTF 8 字符无法正确加载

所以我有一个学校项目,要求您加载一个包含 utf8 字符(如“ł,ą,ż,ź,ć,...”)的文本文件,然后对该文本进行一些编辑。但问题是,如果你...

回答 1 投票 0

什么是<meta charset="utf-8">?

我刚刚开始学习HTML(没有编码背景),不知道这意味着什么。我一般在之后开始代码时写它,但我不知道它意味着什么。 ...

回答 3 投票 0

保持从 Docker 容器进行编码

我在 Docker for Windows 上通过 Powershell 使用 MariaDB。 当我想使用 docker exec 创建 mysqldump 并将文件从容器重定向到主机系统时,编码从 UTF8 更改为 UTF...

回答 1 投票 0

即使输入是 Latin1,PostgreSQL 也可以将条目转换为 UTF-8 吗?

我有psql(PostgreSQL)10.10,client_encoding是UTF8。现在条目是由旧的 Delphi 版本创建的,不能使用 UTF8,因此 DB 中的条目具有未表示为 ... 的特殊符号

回答 2 投票 0

TCPDF 中的泰米尔字体渲染问题

我们使用 TCPDF 开发了泰米尔语文本 PDF 生成(https://github.com/tecnickcom/tcpdf),我们使用了以下泰米尔语字体 tamilavarangal.z,tamilavarangal.php akshar.z,akshar.php tau.z,ta...

回答 1 投票 0

如何更改php代码来解决字符编码问题?

我写了这个php电子邮件发送器代码: 我写了这个 php 电子邮件发送器代码: <?php if($_SERVER["REQUEST_METHOD"] === "POST") {} if (isset($_POST['submit'])) { $name = $_POST['name']; $subject = $_POST['subject']; $mailFrom = $_POST['mail']; $phone = $_POST['phone']; $company = $_POST['company']; $website = $_POST['website']; $message = $_POST['message']; $recaptcha_secret = "xy"; $response = file_get_contents("https://www.google.com/recaptcha/api/siteverify?secret=".$recaptcha_secret."&response=".$_POST['g-recaptcha-response']); $response = json_decode($response, true); if($response["success"] === true){ $mailTo = "[email protected]"; $headers = "From: ".$mailFrom; $txt = "Feladó: ".$name."\nTelefonszám: ".$phone."\nCég: ".$company."\nWeboldal: ".$website."\n\nÜzenet: ".$message; mail($mailTo, $subject, $txt, $headers); header("Location: feedback/koszonjuk"); }else{ header("Location: feedback/error"); } } ?>` 有人使用验证码在我的网站上填写我的表单后,它会向我的服务器端电子邮件地址发送电子邮件。 我希望电子邮件采用 UTF-8 字符编码,但我看不到该问题。这些字符在以下形式的电子邮件中管理不善:öüóőúéá 表单所在的HTML页面设置为UTF-8。 HTML 表单代码: <form action="ajanlatkeres.php" method="post" class="ajanlatkeres-form" accept-charset="utf-8"> <h2>Általános adatok</h2> <input type="text" name="name" placeholder="Teljes név*" class="feedback-input" required> <input type="text" name="mail" placeholder="E-mail*" class="feedback-input" required> <input type="text" name="phone" placeholder="Telefonszám*" class="feedback-input" required> <h2>Vállalkozás adatai</h2> <input type="text" name="company" placeholder="Márkanév" class="feedback-input"> <input type="text" name="website" placeholder="Weboldal" class="feedback-input"> <h2>Üzenet</h2> <input type="hidden" name="subject" value="Ajánlatkérés"> <textarea name="message" placeholder="Írj pár sort projektedről*" class="feedback-input" required></textarea> <div class="g-recaptcha" id="rcaptcha" data-theme="dark" data-sitekey="xy"></div> <br/> <button id="submit_form" class="contactbutton" type="submit" name="submit">Küldés</button> </form> 什么可能导致此问题?它在我的 php 代码中吗? 您可以尝试更改标题: header("Content-Type: text/html; charset=UTF-8;Location: feedback/koszonjuk;"); 和 header("Content-Type: text/html; charset=UTF-8;Location: feedback/error;");

回答 1 投票 0

Proc SQL 到 Postgres UFT8 数据库:不可打印字符显示为正常问号,无法删除

我需要针对我面临的问题提供建议: 我使用 SAS 9.4(桌面版本)通过 Unicode Postgres ODBC 驱动程序连接到 Postgres 数据库。 我正在使用 proc sql 语句来检索数据...

回答 1 投票 0

IntelliJ IDEA 控制台输出中的编码不正确

这似乎真的很疯狂,但我无法在 IntelliJ IDEA 的控制台中对损坏的编码执行任何操作。 我为克服这个问题所做的事情: 在...中设置 -Dfile.encoding=UTF-8 和 -Dfile.encoding=UTF-8

回答 12 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.