我正在尝试将阿拉伯文本分割成单个单词。这是示例代码:
var str = "المادة 1 يولد جميع الناس أحرارًا متساوين في الكرامة والحقوق. وقد وهبوا عقلاً وضميرًا وعليهم أن يعامل بعضهم بعضًا بروح الإخاء.";
var strWithHashtag = "المادة 1 يولد جميع الناس أحرارًا متساوين في الكرامة والحقوق. وقد وهبوا عقلاً وضميرًا وعليهم أن #يعامل بعضهم بعضًا بروح الإخاء.";
var substrings = strWithHashtag.Split(' ');
文本是从https://r12a.github.io/scripts/arabic/复制而来的,它是sample(arabic)下的第一段。我有两个问题:
str
的末尾?يعامل#
变为#يعامل
。如何保持#
标志的原始位置?最终,我需要从RTL语言中提取标签,因此我需要#
作为RTL标签的第一个字符出现。