我正在为我在C中创建的语言编写解释器。目前它可以将源代码放入令牌中,然后将这些令牌解析为AST。在做了一些阅读之后,我得出的结论是,由于遍历树所需的递归量,使用字节码比仅仅遍历AST更快。
所以给定一个AST,我该如何将其转换为字节码?更具体地说,实际存储的函数,变量和常量在哪里?它们是存储在字节码本身中,还是存在专用于存储这些存储器的单独存储区域?
我的AST实现方式的简化视图:
typedef enum {
AST_NODE_INT,
AST_NODE_FLOAT,
AST_NODE_ADD,
// many, many more of these
};
typedef struct _ast_node {
ast_node_type type;
union {
int as_int;
float as_float;
struct as_add {
struct _ast_node *left;
struct _ast_node *right;
};
//more structs, representing the different types in the enum
};
};
我的程序目前需要一些源代码,如
1 + 2
并生成一个AST(这不是C,只是一个表示)
{
type: AST_NODE_ADD,
as_add: {
left: {
type: AST_NODE_INT,
as_int: 1
},
right: {
type: AST_NODE_INT,
as_int: 2
}
}
}
函数变量和常量(至少它们的名称以及将其转换为值所需的任何查找信息)通常存储在符号表中。
在函数调用的情况下,您可以将许多args推送到评估堆栈,然后使用调用指令来调用函数的字节代码。
我建议获得编译器:原理,技术和工具(第2版):Alfred V Aho(又名“龙书”),即使它被命名为“编译器”,该材料也可直接应用。