我正在尝试支持/转换日元数字/标点符号,因此我正在考虑以下字符。
0123456789。.
我将所有数字映射到它们的ASCII对应物,最后2个标点符号映射到ASCII十进制。
我的产品不支持逗号。
这些是日语键盘的数字/小数的所有可能变化吗?我找不到详尽的清单。
您不需要列出所有可能的模式,但要求足够的规范化库。
在Python中
import unicodedata
print(unicodedata.normalize("NFKC", "12,345.67"))
在JavaScript中
"12,345.67".normalize('NFKC')
用PHP
<?php
if (!class_exists('Normalizer')) { exit ('You need to turn on php_intl extension.'); }
echo Normalizer::normalize('12,345.67', Normalizer::NFKC);
结果
12,345.67
为了确保,日语句点(。)不用于小数点,所以你不应该转换它,因为上面的库没有。