我需要获取实际的字符数(而不是字节数),类似于在 V8 中获取字符串长度时的输出。
这对于 Twitter 的使用是必要的,无论使用哪种语言,Twitter 都会按字符数计算,即使使用 UTF-8(它不按字节长度计算)。
例如:
在 chrome/chromium js 控制台中,或在 Nodejs 中:
> "Schöne Grüße".length
< 12
在 Qt 4.8.2 中,尝试
QString someStr = "Schöne Grüße"; cout << someStr.length()
将输出 15,这不是我的目标。
如果您确实想计算字素簇(即用户感知的字符)而不是代码单元,则需要
QTextBoundaryFinder
。这是一个使用示例:
#include <iostream>
#include <QTextBoundaryFinder>
#include <QString>
int main()
{
const QString s=QString::fromUtf8(u8"abc\U00010139def\U00010102g");
std::cout << "String: \"" << s.toStdString() << "\"\n";
std::cout << "Code unit count : " << s.length() << "\n";
QTextBoundaryFinder tbf(QTextBoundaryFinder::Grapheme, s);
int count=0;
while(tbf.toNextBoundary()!=-1)
++count;
std::cout << "Grapheme cluster count: " << count << "\n";
}
输出:
String: "abc𐄹def𐄂g"
Code unit count : 11
Grapheme cluster count: 9