音译/转置NSString中的字符

问题描述 投票:10回答:3

我想将一个西里尔字符串音译成最接近拉丁语的字符串。例如。 “матрешка”=>“matreshka”,“водка”=>“伏特加”。理想情况下,我想在NSString或其他已经知道字母表的所有内容并且可以进行对话的其他地方准备好使用方法。

但是如果iOS API中不存在这样的功能,那么我将完全满意像ruby的tr方法,它只是使用指定为参数的简单映射替换字符串中的字符。

"баба".tr('абвгд', 'abvgd')
ios objective-c iphone nsstring transliteration
3个回答
19
投票

使用CFStringTransform变换标识符尝试CFMutableString的kCFStringTransformToLatin函数,或者使用简单映射创建NSString类别。

由问题海报编辑:更具体地说,它应该是:

NSMutableString *buffer = [@"русский язык" mutableCopy];
CFMutableStringRef bufferRef = (__bridge CFMutableStringRef)buffer;
CFStringTransform(bufferRef, NULL, kCFStringTransformToLatin, false);
NSLog(@"%@", buffer); // outputs "russkij âzyk"

6
投票

如果您不需要变音符号或口音,可以拨打CFStringTransform(bufferRef, NULL, kCFStringTransformStripCombiningMarks, false);

附加文章:http://nshipster.com/cfstringtransform/


5
投票

使用Swift 5,String有一种名为applyingTransform(_:reverse:)的方法。 applyingTransform(_:reverse:)有以下声明:

func applyingTransform(_ transform: StringTransform, reverse: Bool) -> String?

以下Playground代码显示如何使用applyingTransform(_:reverse:)以便从西里尔字符音译到拉丁字符:

import Foundation

let string = "матрешка"
let latinString = string.applyingTransform(StringTransform.toLatin, reverse: false)
let noDiacriticString = latinString?.applyingTransform(StringTransform.stripDiacritics, reverse: false)

print(latinString) // prints: Optional("matreška")
print(noDiacriticString) // prints: Optional("matreska")

作为替代方案,您可以使用Core Foundation CFStringTransform(_:_:_:_:)功能:

import Foundation

let mutableString = NSMutableString(string: "матрешка")

CFStringTransform(mutableString, nil, kCFStringTransformToLatin, false)
print(mutableString) // prints: matreška

CFStringTransform(mutableString, nil, kCFStringTransformStripDiacritics, false)
print(mutableString) // prints: matreska
© www.soinside.com 2019 - 2024. All rights reserved.