std :: string常量的正确习惯用法?

问题描述 投票:24回答:9

我有一个代表DB对象的地图。我希望从中得到“众所周知”的价值观

 std::map<std::string, std::string> dbo;
 ...
 std::string val = map["foo"];

一切都很好但是我觉得“foo”在每次通话时都被转换为临时字符串。当然最好有一个常量的std :: string(当然,与刚刚获取对象的磁盘IO相比,它可能只是一个微小的开销,但我认为它仍然是一个有效的问题)。那么std :: string常量的正确习惯是什么?

例如 - 我可以

 const std::string FOO = "foo";

在hdr中,但后来我得到了多份副本

编辑:还没有回答说如何声明std :: string常量。忽略整个地图,STL等问题。很多代码都是以std :: string为导向的(我当然是这样)并且很自然地需要为它们设置常量而不需要为内存分配反复付费

EDIT2:从曼努埃尔手中接过PDF回答的二级问题,添加了一个不好习惯的例子

编辑3:答案摘要。请注意,我没有包含那些建议创建新字符串类的内容。我很失望,因为我希望有一个简单的东西只能在头文件中工作(如const char * const)。无论如何

a)来自马克b

 std::map<int, std::string> dict;
 const int FOO_IDX = 1;
 ....
 dict[FOO_IDX] = "foo";
 ....
 std:string &val = dbo[dict[FOO_IDX]];

b)来自vlad

 // str.h
 extern const std::string FOO;
 // str.cpp
 const std::string FOO = "foo";

c)来自Roger P.

 // really you cant do it

(b)似乎与我想要的最接近,但有一个致命的缺陷。我不能拥有使用这些字符串的静态模块级代码,因为它们可能尚未构建。我想过(a)​​并且实际上在序列化对象时使用类似的技巧,发送索引而不是字符串,但对于通用解决方案来说似乎有很多管道。很遗憾(c)获胜,std:string没有简单的常量

c++ string constants
9个回答
17
投票

复制和缺少“字符串文字优化”就是std :: strings如何工作,你无法得到你所要求的。部分原因是因为明确避免了虚方法和dtor。无论如何,std :: string接口很复杂。

该标准需要std :: string和std :: map的某个接口,并且这些接口碰巧不允许你想要的优化(作为其他要求的“意外后果”,而不是明确的)。至少,如果你想真正遵循标准的所有细节,他们不允许它。而且你确实希望这样,特别是当这种特定优化使用不同的字符串类时非常容易。

但是,单独的字符串类可以解决这些“问题”(正如你所说,这很少是一个问题),但不幸的是,世界已经有了number_of_programmers + 1。即使考虑到轮重新发明,我发现有一个StaticString类很有用,它有一个std :: string接口的子集:using begin / end,substr,find等。它也不允许修改(并适合字符串文字)那样),只存储一个字符指针和一个大小。您必须小心谨慎,它只使用字符串文字或其他“静态”数据进行初始化,但这在某种程度上可以通过构造界面进行缓解:

struct StaticString {
  template<int N>
  explicit StaticString(char (&data)[N]); // reference to char array
  StaticString(StaticString const&); // copy ctor (which is very cheap)

  static StaticString from_c_str(char const* c_str); // static factory function
  // this only requires that c_str not change and outlive any uses of the
  // resulting object(s), and since it must also be called explicitly, those 
  // requirements aren't hard to enforce; this is provided because it's explicit
  // that strlen is used, and it is not embedded-'\0'-safe as the
  // StaticString(char (&data)[N]) ctor is

  operator char const*() const; // implicit conversion "operator"
  // here the conversion is appropriate, even though I normally dislike these

private:
  StaticString(); // not defined
};

使用:

StaticString s ("abc");
assert(s != "123"); // overload operators for char*
some_func(s); // implicit conversion
some_func(StaticString("abc")); // temporary object initialized from literal

请注意,此类的主要优点是显式避免复制字符串数据,因此可以重用字符串文字存储。这个数据的可执行文件中有一个特殊的位置,它通常都经过了很好的优化,因为它可以追溯到C及以后的最早期。事实上,我认为这个类接近于C ++中应该使用的字符串文字,如果它不符合C兼容性要求。

通过扩展,如果这对您来说是一个非常常见的场景,您也可以编写自己的地图类,这可能比更改字符串类型更容易。


9
投票

这很简单:使用

extern const std::string FOO;

在你的标题中,和

const std::string FOO("foo");

在适当的.cpp文件中。


6
投票
  1. 当你想要的只是一个常量字符串时,可以避免创建std::string的开销。但是你需要为此编写一个特殊的类,因为在STL或Boost中没有类似的东西。或者更好的选择是使用来自Chromium的StringPiece或来自LLVM的StringRef这样的类。有关更多信息,请参阅此related thread
  2. 如果您决定继续使用std::string(您可能会这样做),那么另一个不错的选择是使用Boost MultiIndex容器,它具有以下功能(引用the docs): Boost MultiIndex [...]提供了接受与索引的key_type不同的搜索键的查找操作,当key_type对象创建起来很昂贵时,这是一个特别有用的工具。

由Andrei Alexandrescu撰写的Maps with Expensive Keys(C / C ++ Users Journal,2006年2月)与您的问题有关,是一本非常好的读物。


1
投票

正确的习语就是你正在使用的那个。 99.99%的时间不需要担心std :: string的构造函数的开销。

我想知道编译器是否可以将std :: string的构造函数转换为内部函数?理论上它可能是可能的,但我上面的评论足以解释为什么它没有发生。


1
投票

您似乎已经知道字符串文字在运行时将是什么,因此您可以在枚举值和字符串数组之间设置内部映射。然后,您将在代码中使用枚举而不是实际的const char * literal。

enum ConstStrings
{
    MAP_STRING,
    FOO_STRING,
    NUM_CONST_STRINGS
};

std::string constStrings[NUM_CONST_STRINGS];

bool InitConstStrings()
{
    constStrings[MAP_STRING] = "map";
    constStrings[FOO_STRING] = "foo";
}

// Be careful if you need to use these strings prior to main being called.
bool doInit = InitConstStrings();

const std::string& getString(ConstStrings whichString)
{
    // Feel free to do range checking if you think people will lie to you about the parameter type.
    return constStrings[whichString];
}

然后你会说map[getString(MAP_STRING)]或类似的。

另外,如果您不需要修改它,还可以考虑通过const引用存储返回值而不是复制:

const std::string& val = map["foo"];

1
投票

在C ++ 14中,你可以做到

const std::string FOO = "foo"s;

0
投票

问题在于std::map将关键和值复制到自己的结构中。

你可以有一个std::map<const char *, const char *>,但你必须提供功能对象(或函数)来比较键和值数据,因为这个模板是指针。默认情况下,map会比较指针而不是指针指向的数据。

权衡是一次性复制(std::string)与访问比较器(const char *)。

另一种方法是编写自己的map函数。


0
投票

我认为你要找的是'boost :: flyweight <std :: string>'

这是对共享字符串值的逻辑const引用。非常高效的存储和高性能。


0
投票

我的解决方案(具有以下优势:能够使用以前回答此问题时不存在的C ++ 11功能):

#define INTERN(x) ([]() -> std::string const & { \
    static const std::string y = x; \
    return y; \
}())

my_map[INTERN("key")] = 5;

是的,它是一个宏,它可以使用更好的名称。

© www.soinside.com 2019 - 2024. All rights reserved.