我有一个 std::string 包含要使用 execv 执行的命令,将其转换为 execv() 第二个参数所需的“char *argv[]”的最佳“C++”方法是什么?
澄清一下:
std::string cmd = "mycommand arg1 arg2";
char *cmd_argv[];
StrToArgv(cmd, cmd_argv); // how do I write this function?
execv(cmd_argv[0], cmd_argv);
这里的答案非常不统一。有什么问题:
std::string cmd = "echo hello world";
execl("/bin/sh", "/bin/sh", "-c", cmd.c_str(), NULL);
当系统上已经有一个非常好的命令行解析器时,为什么还要编写一个命令行解析器呢?
(注意:一个很好的原因是你不信任你要执行的字符串。人们希望这已经是真的,但是 shell 会比一个简单的空白分割器对该字符串做“更多”的事情,并且如果你不小心的话,就会打开更多的安全漏洞。)
std::vector<char *> args;
std::istringstream iss(cmd);
std::string token;
while(iss >> token) {
char *arg = new char[token.size() + 1];
copy(token.begin(), token.end(), arg);
arg[token.size()] = '\0';
args.push_back(arg);
}
args.push_back(0);
// now exec with &args[0], and then:
for(size_t i = 0; i < args.size(); i++)
delete[] args[i];
当然,这不适用于像
rm "a file.mp3"
这样使用引号的命令。您可以考虑 POSIX 函数wordexp
,它关心这一点以及更多。
也许来自 Boost.ProgramOptions
split_winmain
。在大多数情况下,Boost 是一个不错的选择。
http://www.boost.org/doc/libs/1_40_0/doc/html/program_options/howto.html#id1396212
如果您只对Windows感兴趣(其他内核通常不知道Windows意义上的命令行),您可以使用API函数
CommandLineToArgvW
,它使用与MS C运行时相同的约定。
一般来说,这取决于平台和/或 shell 的引用风格。 Microsoft C 运行时使用与例如完全不同的风格。猛击!
c_str() 字符串方法和 strtok() 的组合(按空格将其分割)应该会为您提供需要传递给 exec() 及其相关函数的字符串数组。
好吧,我自己已经被这个问题绊倒了很多次了。这是直接的“C”,因此它可以插入到 C 或 C++ 中。它以不同的方式处理单引号和双引号字符串。调用者负责释放 argv[0](如果不为 NULL)和 argv。
#include
#include
#include
#include
typedef enum {
STR2AV_OK = 0,
STR2AV_UNBALANCED_QUOTE
} str_to_argv_err_t;
#ifndef NUL
#define NUL '\0'
#endif
static char const nomem[] = "no memory for %d byte allocation\n";
static str_to_argv_err_t
copy_raw_string(char ** dest_p, char ** src_p);
static str_to_argv_err_t
copy_cooked_string(char ** dest_p, char ** src_p);
static inline void *
Xmalloc(size_t sz)
{
void * res = malloc(sz);
if (res == NULL) {
fprintf(stderr, nomem, sz);
exit(EXIT_FAILURE);
}
return res;
}
static inline void *
Xrealloc(void * ptr, size_t sz)
{
void * res = realloc(ptr, sz);
if (res == NULL) {
fprintf(stderr, nomem, sz);
exit(EXIT_FAILURE);
}
return res;
}
str_to_argv_err_t
string_to_argv(char const * str, int * argc_p, char *** argv_p)
{
int argc = 0;
int act = 10;
char ** res = Xmalloc(sizeof(char *) * 10);
char ** argv = res;
char * scan;
char * dest;
str_to_argv_err_t err;
while (isspace((unsigned char)*str)) str++;
str = scan = strdup(str);
for (;;) {
while (isspace((unsigned char)*scan)) scan++;
if (*scan == NUL)
break;
if (++argc >= act) {
act += act / 2;
res = Xrealloc(res, act * sizeof(char *));
argv = res + (argc - 1);
}
*(argv++) = dest = scan;
for (;;) {
char ch = *(scan++);
switch (ch) {
case NUL:
goto done;
case '\\':
if ( (*(dest++) = *(scan++)) == NUL)
goto done;
break;
case '\'':
err = copy_raw_string(&dest, &scan);
if (err != STR2AV_OK)
goto error_leave;
break;
case '"':
err = copy_cooked_string(&dest, &scan);
if (err != STR2AV_OK)
goto error_leave;
break;
case ' ':
case '\t':
case '\n':
case '\f':
case '\r':
case '\v':
case '\b':
goto token_done;
default:
*(dest++) = ch;
}
}
token_done:
*dest = NUL;
}
done:
*argv_p = res;
*argc_p = argc;
*argv = NULL;
if (argc == 0)
free((void *)str);
return STR2AV_OK;
error_leave:
free(res);
free((void *)str);
return err;
}
static str_to_argv_err_t
copy_raw_string(char ** dest_p, char ** src_p)
{
for (;;) {
char ch = *((*src_p)++);
switch (ch) {
case NUL: return STR2AV_UNBALANCED_QUOTE;
case '\'':
*(*dest_p) = NUL;
return STR2AV_OK;
case '\\':
ch = *((*src_p)++);
switch (ch) {
case NUL:
return STR2AV_UNBALANCED_QUOTE;
default:
/*
* unknown/invalid escape. Copy escape character.
*/
*((*dest_p)++) = '\\';
break;
case '\\':
case '\'':
break;
}
/* FALLTHROUGH */
default:
*((*dest_p)++) = ch;
break;
}
}
}
static char
escape_convt(char ** src_p)
{
char ch = *((*src_p)++);
/*
* Escape character is always eaten. The next character is sometimes
* treated specially.
*/
switch (ch) {
case 'a': ch = '\a'; break;
case 'b': ch = '\b'; break;
case 't': ch = '\t'; break;
case 'n': ch = '\n'; break;
case 'v': ch = '\v'; break;
case 'f': ch = '\f'; break;
case 'r': ch = '\r'; break;
}
return ch;
}
static str_to_argv_err_t
copy_cooked_string(char ** dest_p, char ** src_p)
{
for (;;) {
char ch = *((*src_p)++);
switch (ch) {
case NUL: return STR2AV_UNBALANCED_QUOTE;
case '"':
*(*dest_p) = NUL;
return STR2AV_OK;
case '\\':
ch = escape_convt(src_p);
if (ch == NUL)
return STR2AV_UNBALANCED_QUOTE;
/* FALLTHROUGH */
default:
*((*dest_p)++) = ch;
break;
}
}
}
这是 litb 答案的变体,但没有所有手动内存分配。它仍然无法处理引用。
#include <vector>
#include <string>
#include <sstream>
std::string cmd = "mycommand arg1 arg2";
std::istringstream ss(cmd);
std::string arg;
std::list<std::string> ls;
std::vector<char*> v;
while (ss >> arg)
{
ls.push_back(arg);
v.push_back(const_cast<char*>(ls.back().c_str()));
}
v.push_back(0); // need terminating null pointer
execv(v[0], &v[0]);
我对 const_cast<> 感觉有点肮脏,但程序确实不应该修改 argv 字符串的内容。
可能现在回答这个问题已经太晚了,但你可以使用标准 POSIX 函数 glob 或 wordexp:
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <wordexp.h>
int
main(int argc, char **argv)
{
wordexp_t p;
char *exec_path = "/bin/ls";
p.we_offs = 1;
wordexp("-l -t /etc", &p, WRDE_DOOFFS);
p.we_wordv[ 0 ] = exec_path;
execv(exec_path, p.we_wordv);
/* This code is unreachable */
exit(EXIT_SUCCESS);
}
它会准备3个参数:
-l
(长列表格式)、-t
(按修改时间排序)和目录/etc
列出,并运行/bin/ls
。调用 wordexp()
给出的结果与之前推荐的调用 /bin/sh -c
完全相同,但生成的进程将没有父进程 /bin/sh
。
可以使用std::string的c_str()函数转换为char*。 strtok 函数将使用 ' ' 分隔符分割字符串。
Matt Peitrek 的 LIBTINYC 有一个名为 argcargv.cpp 的模块,它接受一个字符串并将其解析为参数数组,同时考虑带引号的参数。请注意,它是特定于 Windows 的,但它非常简单,因此应该很容易迁移到您想要的任何平台。
如果你这样做,还要更改它以将计数的位置和指向 argv 数组的指针作为参数,而不是使用 extern(只是我的一点建议)。 Matt 不需要它,因为 LIBTINYC 是 运行时。
或者,您可以查看编译器的运行时源(几乎所有编译器都提供它),看看它们如何解析命令行,然后直接调用它(如果事实证明可行)或借用那段代码的想法。
事实证明,boost 程序选项中存在一个隐藏的功能。 split_unix() 函数适用于转义和引用的命令行。
#include "boost/program_options/parsers.hpp"
auto parts = boost::program_options::split_unix(commandLine);
std::vector<char*> cstrings ;
for(auto& str : parts){
cstrings.push_back(const_cast<char*> (str.c_str()));
}
int argc = (int)cstrings.size();
char** argv = cstrings.data();
glib 有一个
g_shell_parse_argv
:
gboolean
g_shell_parse_argv (
const gchar* command_line,
gint* argcp,
gchar*** argvp,
GError** error
)