utf-8 相关问题

UTF-8是一种字符编码,它使用一到四个字节的字节序列来描述每个Unicode代码点。它向后兼容ASCII,同时仍支持所有Unicode代码点的表示。

如何查找在读取任何使用“utf-8”编码的文件时抛出 UnicodeDecodeError 的字符

从 pandas read_csv 读取文件时,出现 UnicodeDecodeError。 句法: df = pd.read_csv("file_name.csv", sep='|') UnicodeDecodeError:“utf-8”编解码器无法解码位置中的字节 0xa0...

回答 3 投票 0

如何通过 pandas dataframe 读取包含 utf-8 值的 .csv 文件

我正在尝试读取某些列中包含 utf-8 数据的 .csv 文件。读取的方法是使用pandas dataframe。代码如下: df = pd.read_csv('Cancer_training.csv',

回答 3 投票 0

在使用 preg_match() 匹配之前获取多字节字符计数(PREG_OFFSET_CAPTURE 参数对字节数毫无帮助)

我正在尝试使用 preg_match 搜索 UTF8 编码的字符串。 preg_match('/H/u', "\xC2\xA1Hola!", $a_matches, PREG_OFFSET_CAPTURE); 回声 $a_matches[0][1]; 这应该打印 1,因为“H&

回答 10 投票 0

preg_match 和 UTF-8

我正在尝试使用 preg_match 搜索 UTF8 编码的字符串。 preg_match('/H/u', "\xC2\xA1Hola!", $a_matches, PREG_OFFSET_CAPTURE); 回声 $a_matches[0][1]; 这应该打印 1,因为“H”位于 inde...

回答 10 投票 0

PHP 多字节正则表达式不适用于 UTF-8

我有 UTF-8 字符串,我想搜索所有出现的 img_(\d+)。 我试过原版的 $pattern = '/img_(\d+)/u'; preg_match_all($pattern, $text, $matches, PREG_OFFSET_CAPTURE); 但它...

回答 1 投票 0

如何在Java中将UTF-8转换为US-Ascii

我们有一个系统,客户(主要是欧洲客户)输入文本(UTF-8),必须分发到不同的系统,其中大多数接受 UTF-8,但现在我们还必须将文本分发到...

回答 10 投票 0

致命错误:未捕获 mysqli_sql_exception:错误的字符串值:'\xF6'

我的托管提供商将character_set_server和character_set_database系统变量的mysql服务器默认值从latin1更改为utf8mb4。 从那时起,文件上传功能就失效了

回答 1 投票 0

在 SQL Server 中生成中文的 UTF-8 MD5 哈希值

SELECT LOWER(CONVERT(VARCHAR(32), HASHBYTES('MD5', 'a'), 2)); 结果:0cc175b9c0f1b6a831c399e269772661 还行吧。 SELECT LOWER(CONVERT(VARCHAR(32), HASHBYTES('MD5', '啊'), 2)); 结果:

回答 1 投票 0

kotlin android UTF-8 字符转换错误

我遇到了 kotlin android (API 29) 的基本问题 导入 kotlin.text.Charsets.UTF_8 var buf = byteArrayOf(0xF0.toByte(), 0xa9.toByte(), 0xbd.toByte(), 0xbe.toByte()) var s = 字符串( buf,

回答 1 投票 0

在 Windows 上使用 Maven 运行的 Spring 集成测试未设置 UTF-8 编码

自从我更新了 Windows 10 并安装了新的 OpenJDK 11.0.4 以来,我的 Spring 集成测试不再在 Maven 上下文中运行。在 Eclipse 中启动它很好并且仍然工作但是运行...

回答 3 投票 0

“ascii”编解码器无法解码位置 0 中的字节 0xef:序号不在范围内(128):BookNLP

我正在尝试在 Colab 中的 txt 文件上运行 BookNLP 模型,但我不断收到错误。 代码: input_file=“爱丽丝.txt” 输出目录=“爱丽丝” book_id=“爱丽丝” 书本LP。

回答 1 投票 0

当我运行sql文件时,我得到了额外的字符

我有一个 .sql 文件来创建 Postgres 函数: 创建函数 id_generator°generateid() 返回 SETOF 整数 AS $身体$ 开始 返回查询选择最大值(ua_id) 来自用户属性...

回答 1 投票 0

如何在rust中从ascii解码? rust 的 String::from_utf8_lossy() 的类似物是什么?

我有以下代码: fn handle_client(mut 流: TcpStream) -> () { 让 mut 缓冲区 = [0;第4096章 Stream.read(&mut buffer).expect("读取失败"); 让path_request:Co...

回答 2 投票 0

在Python中使用psycopg2连接到PostgreSQL时出现UnicodeDecodeError

我在尝试使用 Python 中的 psycopg2 库连接到 PostgreSQL 时遇到问题。我收到以下错误: 回溯(最近一次调用最后一次): 文件“c:\Users erre\Proje...

回答 1 投票 0

如何在rust中从ascii解码? rust 的 String::from_ut8_lossy() 的类似物是什么?

我有以下代码: fn handle_client(mut 流: TcpStream) -> () { 让 mut 缓冲区 = [0;第4096章 Stream.read(&mut buffer).expect("读取失败"); 让path_request:Co...

回答 1 投票 0

在 UnicodeString 中存储 UTF-8 字符串

在 Delphi 2007 中,您可以将 UTF-8 字符串存储在 WideString 中,然后将其传递给 Win32 函数,例如 变量 UnicodeStr:宽字符串; UTF8Str:宽字符串; 开始 UnicodeStr:='一些 unicode te...

回答 4 投票 0

PHP 字符串函数与 mbstring 函数

我的申请到目前为止只有英文版。整个模板和数据库的内容编码均为 UTF-8。我现在正在寻求将应用程序国际化/翻译成

回答 3 投票 0

阿拉伯字符编码问题:UTF-8 与 Windows-1256

快速背景:我继承了一个包含英语和阿拉伯语文本组合的大型 SQL 转储文件,并且(我认为)它最初是使用“latin1”导出的。我更改了所有出现的“拉丁语...

回答 5 投票 0

PHP CSV 编码不是 utf-8 [重复]

我正在使用 PHP 生成 CSV 文件并将其保存在硬盘上(我不想下载)。数据库字符集是utf8_general_ci,里面有像度数符号(°)这样的字符,...

回答 1 投票 0

Python 的 Black 格式化程序给出解码错误“不是 utf-8 字符” - 我怎样才能告诉 black 使用“UTF-16”?

我添加了一个神奇的标题: # -*- 编码:utf-8 -*- 结果没有变化。 输入文件由 intelliJ IDEA 2023.2.2 创建。 几个文件给出了相同的错误。 我看到评论暗示 utf-8 是

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.