字符编码问题-保存在Textarea中后,字符替换为随机字符

问题描述 投票:0回答:1

我正在与一家第三方公司合作,并且我试图/希望在提请他们之前确定字符编码问题的原因。

[该公司有一个自定义的拖放编辑器,用于在其平台上设计与我进行Beta测试的网站。在编辑器中,他们有一个Raw HTML小部件,我也可以拖动它并添加自己的内容。问题是,当我使用检查器工具从某人的旧网站复制HTML并将其粘贴到他们的此小部件中时,所有撇号和双引号都替换为“乱码”。当我尝试将内容粘贴到记事本,notepad ++,崇高编辑器中,然后将其粘贴到其Raw HTML编辑器中时,我也遇到同样的问题。

以下是该问题的记录和一些示例:https://streamable.com/phwn2

这里是已知的要替换的字符以及它们要替换的内容

  • ’变成â™

  • “变成âœ

  • ”变成â

  • +变成(空格)

  • Å变成Ã…

  • “保持为”

  • '保留为'

有人看到带有这些字符的图案,还是知道替换这些字符的原因是什么?我觉得这是某种编码问题,但是当我之前向他们提出时,他们提到“这就是它的工作方式”。我知道这不是真的,因为WordPress拖放编辑器永远不会发生这种情况。我怎样才能说服他们这是一个可以解决的问题,而不是每次复制和粘贴一些text / html时都不必手动替换这些字符?

unicode character-encoding special-characters non-ascii-characters htmlspecialchars
1个回答
0
投票

该网站可能使用UTF-8编码,而该公司的编辑器可能正在使用Windows-1252编码。在第一个示例中,右单引号具有UTF-8编码e2 8099。当使用Windows-1252的程序读取这些字节中的每个字节时,您将获得“带抑扬符的小拉丁字母a”(e2),[未定义] 80和“商标”(99)。我还没有检查其他转换。如果这是问题所在,那么您可以采取一种解决方法,先将复制的字符转换为带有iconv的目标编码,然后再粘贴到公司的编辑器中。

© www.soinside.com 2019 - 2024. All rights reserved.