C#:如何分割阿拉伯文字并将#号保持在其原始位置

问题描述 投票:0回答:1

我正在尝试将阿拉伯文本分割成单个单词。这是示例代码:

var str = "المادة 1 يولد جميع الناس أحرارًا متساوين في الكرامة والحقوق. وقد وهبوا عقلاً وضميرًا وعليهم أن يعامل بعضهم بعضًا بروح الإخاء.";
var strWithHashtag = "المادة 1 يولد جميع الناس أحرارًا متساوين في الكرامة والحقوق. وقد وهبوا عقلاً وضميرًا وعليهم أن #يعامل بعضهم بعضًا بروح الإخاء.";
var substrings = strWithHashtag.Split(' ');

文本是从https://r12a.github.io/scripts/arabic/复制而来的,它是sample(arabic)下的第一段。我有两个问题:

  • 为什么即使在网页上第一个字符出现时也将句号放在str的末尾?
  • [将字符串分割为单个单词时,يعامل#变为#يعامل。如何保持#标志的原始位置?最终,我需要从RTL语言中提取标签,因此我需要#作为RTL标签的第一个字符出现。
c# .net split arabic
1个回答
0
投票
© www.soinside.com 2019 - 2024. All rights reserved.