我有一个代表DB对象的地图。我希望从中得到“众所周知”的价值观
std::map<std::string, std::string> dbo;
...
std::string val = map["foo"];
一切都很好但是我觉得“foo”在每次通话时都被转换为临时字符串。当然最好有一个常量的std :: string(当然,与刚刚获取对象的磁盘IO相比,它可能只是一个微小的开销,但我认为它仍然是一个有效的问题)。那么std :: string常量的正确习惯是什么?
例如 - 我可以
const std::string FOO = "foo";
在hdr中,但后来我得到了多份副本
编辑:还没有回答说如何声明std :: string常量。忽略整个地图,STL等问题。很多代码都是以std :: string为导向的(我当然是这样)并且很自然地需要为它们设置常量而不需要为内存分配反复付费
EDIT2:从曼努埃尔手中接过PDF回答的二级问题,添加了一个不好习惯的例子
编辑3:答案摘要。请注意,我没有包含那些建议创建新字符串类的内容。我很失望,因为我希望有一个简单的东西只能在头文件中工作(如const char * const)。无论如何
a)来自马克b
std::map<int, std::string> dict;
const int FOO_IDX = 1;
....
dict[FOO_IDX] = "foo";
....
std:string &val = dbo[dict[FOO_IDX]];
b)来自vlad
// str.h
extern const std::string FOO;
// str.cpp
const std::string FOO = "foo";
c)来自Roger P.
// really you cant do it
(b)似乎与我想要的最接近,但有一个致命的缺陷。我不能拥有使用这些字符串的静态模块级代码,因为它们可能尚未构建。我想过(a)并且实际上在序列化对象时使用类似的技巧,发送索引而不是字符串,但对于通用解决方案来说似乎有很多管道。很遗憾(c)获胜,std:string没有简单的常量
复制和缺少“字符串文字优化”就是std :: strings如何工作,你无法得到你所要求的。部分原因是因为明确避免了虚方法和dtor。无论如何,std :: string接口很复杂。
该标准需要std :: string和std :: map的某个接口,并且这些接口碰巧不允许你想要的优化(作为其他要求的“意外后果”,而不是明确的)。至少,如果你想真正遵循标准的所有细节,他们不允许它。而且你确实希望这样,特别是当这种特定优化使用不同的字符串类时非常容易。
但是,单独的字符串类可以解决这些“问题”(正如你所说,这很少是一个问题),但不幸的是,世界已经有了number_of_programmers + 1
。即使考虑到轮重新发明,我发现有一个StaticString类很有用,它有一个std :: string接口的子集:using begin / end,substr,find等。它也不允许修改(并适合字符串文字)那样),只存储一个字符指针和一个大小。您必须小心谨慎,它只使用字符串文字或其他“静态”数据进行初始化,但这在某种程度上可以通过构造界面进行缓解:
struct StaticString {
template<int N>
explicit StaticString(char (&data)[N]); // reference to char array
StaticString(StaticString const&); // copy ctor (which is very cheap)
static StaticString from_c_str(char const* c_str); // static factory function
// this only requires that c_str not change and outlive any uses of the
// resulting object(s), and since it must also be called explicitly, those
// requirements aren't hard to enforce; this is provided because it's explicit
// that strlen is used, and it is not embedded-'\0'-safe as the
// StaticString(char (&data)[N]) ctor is
operator char const*() const; // implicit conversion "operator"
// here the conversion is appropriate, even though I normally dislike these
private:
StaticString(); // not defined
};
使用:
StaticString s ("abc");
assert(s != "123"); // overload operators for char*
some_func(s); // implicit conversion
some_func(StaticString("abc")); // temporary object initialized from literal
请注意,此类的主要优点是显式避免复制字符串数据,因此可以重用字符串文字存储。这个数据的可执行文件中有一个特殊的位置,它通常都经过了很好的优化,因为它可以追溯到C及以后的最早期。事实上,我认为这个类接近于C ++中应该使用的字符串文字,如果它不符合C兼容性要求。
通过扩展,如果这对您来说是一个非常常见的场景,您也可以编写自己的地图类,这可能比更改字符串类型更容易。
这很简单:使用
extern const std::string FOO;
在你的标题中,和
const std::string FOO("foo");
在适当的.cpp
文件中。
std::string
的开销。但是你需要为此编写一个特殊的类,因为在STL或Boost中没有类似的东西。或者更好的选择是使用来自Chromium的StringPiece
或来自LLVM的StringRef
这样的类。有关更多信息,请参阅此related thread。std::string
(您可能会这样做),那么另一个不错的选择是使用Boost MultiIndex容器,它具有以下功能(引用the docs):
Boost MultiIndex [...]提供了接受与索引的key_type不同的搜索键的查找操作,当key_type对象创建起来很昂贵时,这是一个特别有用的工具。由Andrei Alexandrescu撰写的Maps with Expensive Keys(C / C ++ Users Journal,2006年2月)与您的问题有关,是一本非常好的读物。
正确的习语就是你正在使用的那个。 99.99%的时间不需要担心std :: string的构造函数的开销。
我想知道编译器是否可以将std :: string的构造函数转换为内部函数?理论上它可能是可能的,但我上面的评论足以解释为什么它没有发生。
您似乎已经知道字符串文字在运行时将是什么,因此您可以在枚举值和字符串数组之间设置内部映射。然后,您将在代码中使用枚举而不是实际的const char * literal。
enum ConstStrings
{
MAP_STRING,
FOO_STRING,
NUM_CONST_STRINGS
};
std::string constStrings[NUM_CONST_STRINGS];
bool InitConstStrings()
{
constStrings[MAP_STRING] = "map";
constStrings[FOO_STRING] = "foo";
}
// Be careful if you need to use these strings prior to main being called.
bool doInit = InitConstStrings();
const std::string& getString(ConstStrings whichString)
{
// Feel free to do range checking if you think people will lie to you about the parameter type.
return constStrings[whichString];
}
然后你会说map[getString(MAP_STRING)]
或类似的。
另外,如果您不需要修改它,还可以考虑通过const引用存储返回值而不是复制:
const std::string& val = map["foo"];
在C ++ 14中,你可以做到
const std::string FOO = "foo"s;
问题在于std::map
将关键和值复制到自己的结构中。
你可以有一个std::map<const char *, const char *>
,但你必须提供功能对象(或函数)来比较键和值数据,因为这个模板是指针。默认情况下,map
会比较指针而不是指针指向的数据。
权衡是一次性复制(std::string
)与访问比较器(const char *
)。
另一种方法是编写自己的map
函数。
我认为你要找的是'boost :: flyweight <std :: string>'
这是对共享字符串值的逻辑const引用。非常高效的存储和高性能。
我的解决方案(具有以下优势:能够使用以前回答此问题时不存在的C ++ 11功能):
#define INTERN(x) ([]() -> std::string const & { \
static const std::string y = x; \
return y; \
}())
my_map[INTERN("key")] = 5;
是的,它是一个宏,它可以使用更好的名称。