使用多个 lex 文件并在执行时将其合并为一个

Question

我有多个 lex 文件，即 keywords.l、identifier.l 和literals.l

关键词.l:

%{
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
/*#include "../yacc/grammer.tab.h"*/
%}

class "class"
from "from"
None "None"
continue "continue"
global "global"
pass "pass"
def "def"
if "if"
raise "raise"
del "del"
import "import"
return "return"
as "as"
elif "elif"
try "try"
assert "assert"
else "else"
while "while"
async "async"
except "except"
lambda "lambda"
with "with"
await "await"
finally "finally"
nonlocal "nonlocal"
yield "yield"
break "break"
for "for"

%%
{class} {printf("keyword ");}
{from} {printf("keyword ");}
{None} {printf("keyword ");}
{continue} {printf("keyword ");}
{global} {printf("keyword ");}
{pass} {printf("keyword ");}
{def} {printf("keyword ");}
{if} {printf("keyword ");}
{raise} {printf("keyword ");}
{del} {printf("keyword ");}
{import} {printf("keyword ");}
{return} {printf("keyword ");}
{as} {printf("keyword ");}
{elif} {printf("keyword ");}
{try} {printf("keyword ");}
{assert} {printf("keyword ");}
{else} {printf("keyword ");}
{while} {printf("keyword ");}
{async} {printf("keyword ");}
{except} {printf("keyword ");}
{lambda} {printf("keyword ");}
{with} {printf("keyword ");}
{await} {printf("keyword ");}
{finally} {printf("keyword ");}
{nonlocal} {printf("keyword ");}
{yield} {printf("keyword ");}
{break} {printf("keyword ");}
{for} {printf("keyword ");}

%%


int yywrap() { 
  return 1; 
}

标识符.l

%{
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include "../yacc/grammer.tab.h"

typedef struct SymbolTable{
  char token[10];
  char attr[100];
  char type[10];
} SymbolTable;

SymbolTable ST[1000];
int STn=0;

void printST(){
  int i;
  printf("\nPrinting Symbol Table ");
  for(i=0;i<STn;i++){
    printf("\n%s : %s",ST[i].token, ST[i].attr);
  }
}

int installID(char *a, char *t){
  int i;
  for(i=0;i<STn;i++){
    if((strcmp(ST[i].token, "ID")==0)&&(strcmp(ST[i].attr, a)==0)){
      return i;
    }
  }
  strcpy(ST[STn].token,"ID");
  strcpy(ST[STn].attr,a);
  strcpy(ST[STn].type,t);
  STn++;
  return STn-1;
}

%}

id [a-zA-Z_][a-zA-Z_0-9]*

%%

%union {
    char *lexeme;
    int value;
}

%token <lexeme> ID

{id} {
    printf("\nIdentifier : %s ", yytext);
    int a = installID(yytext, NULL);
    yylval.lexeme = strdup(yytext);
    return ID;
}

%%

int yywrap() { 
  return 1; 
}

文字.l

%{
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include "../yacc/grammer.tab.h"

typedef struct SymbolTable{
  char token[10];
  char attr[100];
  char type[10];
}SymbolTable;

SymbolTable ST[1000];
int STn=0;

void printST(){
  int i;
  printf("\nPrinting Symbol Table ");
  for(i=0;i<STn;i++){
    printf("\n%s : %s",ST[i].token, ST[i].attr);
  }
}

int installLit(char *b, char *t){
  int i;
  for(i=0;i<STn;i++){
    if((strcmp(ST[i].token, "NUM")==0)&&(strcmp(ST[i].attr, b)==0)){
      return i;
    }
  }
  strcpy(ST[STn].token,"LITERAL");
  strcpy(ST[STn].attr,b);
  strcpy(ST[STn].type,t);
  STn++;
  return STn-1;
}

%}

int [-]?[0-9]+
float [-]?[0-9]+([.][0-9]+)?([Ee][+-]?[0-9]+)?
bool (True|False)
str (\"([^\"\\\\]|\\\\.)*\")|('([^'\\\\]|\\\\.)*')

%%
{int} {printf("\nInteger : %s ",yytext);
      int a = installLit(yytext,"INT");
      yylval.value = = strdup(yytext);
      return LITERAL;}

{str} {printf("String ");
      int a = installLit(yytext,"STR");
      yylval.value = = strdup(yytext);
      return LITERAL;}

{float} {printf("Float ");
      int a = installLit(yytext,"FLOAT");
      yylval.value = = strdup(yytext);
      return LITERAL;}

{bool} {printf("Boolean ");
      int a = installLit(yytext,"BOOL");
      yylval.value = = strdup(yytext);
      return LITERAL;}

%union {
    char *lexeme;
    int value;
}

%token <value> LITERAL
%%

int yywrap() { 
  return 1; 
}

我想将这 3 个 lex 文件组合成一个文件，就像我们在 C、Python 等中导入包/文件一样。

我尝试这样做

%{
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include "../yacc/grammer.tab.h";
#include "keywords.l"
#include "literals.l"
#include "identifier.l"
%}

%%

%union {
    char *lexeme;
    int value;
}

%token <lexeme> ID

%%

int yywrap(){
  return 1;
}

但是在导入时，导入的文件被视为 C 文件而不是 .l 文件。

flex tokens.l

gcc lex.yy.c
tokens.l:5:33: warning: extra tokens at end of #include directive
 #include "../yacc/grammer.tab.h";
                                 ^
In file included from tokens.l:6:0:
keywords.l:1:1: error: expected identifier or '(' before '%' token
 %{
 ^
keywords.l:8:7: error: expected '=', ',', ';', 'asm' or '__attribute__' before string constant
 class "class"
       ^
keywords.l:38:9: error: expected identifier or '(' before '{' token
 {class} {printf("keyword ");}
         ^
keywords.l:39:1: error: expected identifier or '(' before '{' token
 {from} {printf("keyword ");}
 ^
keywords.l:39:8: error: expected identifier or '(' before '{' token
 {from} {printf("keyword ");}
        ^
keywords.l:40:1: error: expected identifier or '(' before '{' token
 {None} {printf("keyword ");}
 ^
keywords.l:40:8: error: expected identifier or '(' before '{' token
 {None} {printf("keyword ");}
        ^
keywords.l:41:1: error: expected identifier or '(' before '{' token
 {continue} {printf("keyword ");}
 ^
keywords.l:41:12: error: expected identifier or '(' before '{' token
 {continue} {printf("keyword ");}
            ^
keywords.l:42:1: error: expected identifier or '(' before '{' token
 {global} {printf("keyword ");}
 ^
keywords.l:42:10: error: expected identifier or '(' before '{' token
 {global} {printf("keyword ");}
          ^
keywords.l:43:1: error: expected identifier or '(' before '{' token
 {pass} {printf("keyword ");}
 ^
keywords.l:43:8: error: expected identifier or '(' before '{' token
 {pass} {printf("keyword ");}
        ^
keywords.l:44:1: error: expected identifier or '(' before '{' token
 {def} {printf("keyword ");}
 ^
keywords.l:44:7: error: expected identifier or '(' before '{' token
 {def} {printf("keyword ");}
       ^
keywords.l:45:1: error: expected identifier or '(' before '{' token
 {if} {printf("keyword ");}
 ^
keywords.l:45:6: error: expected identifier or '(' before '{' token
 {if} {printf("keyword ");}
      ^
keywords.l:46:1: error: expected identifier or '(' before '{' token
 {raise} {printf("keyword ");}
 ^
keywords.l:46:9: error: expected identifier or '(' before '{' token
 {raise} {printf("keyword ");}
         ^
keywords.l:47:1: error: expected identifier or '(' before '{' token
 {del} {printf("keyword ");}
 ^
keywords.l:47:7: error: expected identifier or '(' before '{' token
 {del} {printf("keyword ");}
       ^
keywords.l:48:1: error: expected identifier or '(' before '{' token
 {import} {printf("keyword ");}
 ^
keywords.l:48:10: error: expected identifier or '(' before '{' token
 {import} {printf("keyword ");}
          ^
keywords.l:49:1: error: expected identifier or '(' before '{' token
 {return} {printf("keyword ");}
 ^
keywords.l:49:10: error: expected identifier or '(' before '{' token
 {return} {printf("keyword ");}
          ^
keywords.l:50:1: error: expected identifier or '(' before '{' token
 {as} {printf("keyword ");}
 ^
keywords.l:50:6: error: expected identifier or '(' before '{' token
 {as} {printf("keyword ");}
      ^
keywords.l:51:1: error: expected identifier or '(' before '{' token
 {elif} {printf("keyword ");}
 ^
keywords.l:51:8: error: expected identifier or '(' before '{' token
 {elif} {printf("keyword ");}
        ^
keywords.l:52:1: error: expected identifier or '(' before '{' token
 {try} {printf("keyword ");}
 ^
keywords.l:52:7: error: expected identifier or '(' before '{' token
 {try} {printf("keyword ");}
       ^
keywords.l:53:1: error: expected identifier or '(' before '{' token
 {assert} {printf("keyword ");}
 ^
keywords.l:53:10: error: expected identifier or '(' before '{' token
 {assert} {printf("keyword ");}
          ^
keywords.l:54:1: error: expected identifier or '(' before '{' token
 {else} {printf("keyword ");}
 ^
keywords.l:54:8: error: expected identifier or '(' before '{' token
 {else} {printf("keyword ");}
        ^
keywords.l:55:1: error: expected identifier or '(' before '{' token
 {while} {printf("keyword ");}
 ^
keywords.l:55:9: error: expected identifier or '(' before '{' token
 {while} {printf("keyword ");}
         ^
keywords.l:56:1: error: expected identifier or '(' before '{' token
 {async} {printf("keyword ");}
 ^
keywords.l:56:9: error: expected identifier or '(' before '{' token
 {async} {printf("keyword ");}
         ^
keywords.l:57:1: error: expected identifier or '(' before '{' token
 {except} {printf("keyword ");}
 ^
keywords.l:57:10: error: expected identifier or '(' before '{' token
 {except} {printf("keyword ");}
          ^
keywords.l:58:1: error: expected identifier or '(' before '{' token
 {lambda} {printf("keyword ");}
 ^
keywords.l:58:10: error: expected identifier or '(' before '{' token
 {lambda} {printf("keyword ");}
          ^
keywords.l:59:1: error: expected identifier or '(' before '{' token
 {with} {printf("keyword ");}
 ^
keywords.l:59:8: error: expected identifier or '(' before '{' token
 {with} {printf("keyword ");}
        ^
keywords.l:60:1: error: expected identifier or '(' before '{' token
 {await} {printf("keyword ");}
 ^
keywords.l:60:9: error: expected identifier or '(' before '{' token
 {await} {printf("keyword ");}
         ^
keywords.l:61:1: error: expected identifier or '(' before '{' token
 {finally} {printf("keyword ");}
 ^
keywords.l:61:11: error: expected identifier or '(' before '{' token
 {finally} {printf("keyword ");}
           ^
keywords.l:62:1: error: expected identifier or '(' before '{' token
 {nonlocal} {printf("keyword ");}
 ^
keywords.l:62:12: error: expected identifier or '(' before '{' token
 {nonlocal} {printf("keyword ");}
            ^
keywords.l:63:1: error: expected identifier or '(' before '{' token
 {yield} {printf("keyword ");}
 ^
keywords.l:63:9: error: expected identifier or '(' before '{' token
 {yield} {printf("keyword ");}
         ^
keywords.l:64:1: error: expected identifier or '(' before '{' token
 {break} {printf("keyword ");}
 ^
keywords.l:64:9: error: expected identifier or '(' before '{' token
 {break} {printf("keyword ");}
         ^
keywords.l:65:1: error: expected identifier or '(' before '{' token
 {for} {printf("keyword ");}
 ^
keywords.l:65:7: error: expected identifier or '(' before '{' token
 {for} {printf("keyword ");}
       ^
keywords.l:67:1: error: expected identifier or '(' before '%' token
 %%
 ^
In file included from tokens.l:7:0:
literals.l:1:1: error: expected identifier or '(' before '%' token
 %{
 ^
In file included from tokens.l:7:0:
literals.l:40:5: error: expected identifier or '(' before '[' token
 int [-]?[0-9]+
     ^
literals.l:43:1: error: stray '\' in program
 str (\"([^\"\\\\]|\\\\.)*\")|('([^'\\\\]|\\\\.)*')
 ^
literals.l:43:7: warning: missing terminating " character
 str (\"([^\"\\\\]|\\\\.)*\")|('([^'\\\\]|\\\\.)*')
       ^
literals.l:43:1: error: missing terminating " character
 str (\"([^\"\\\\]|\\\\.)*\")|('([^'\\\\]|\\\\.)*')
 ^
literals.l:46:7: error: expected identifier or '(' before '{' token
 {int} {printf("\nInteger : %s ",yytext);
       ^
literals.l:51:1: error: expected identifier or '(' before '{' token
 {str} {printf("String ");
 ^
literals.l:51:7: error: expected identifier or '(' before '{' token
 {str} {printf("String ");
       ^
literals.l:56:1: error: expected identifier or '(' before '{' token
 {float} {printf("Float ");
 ^
literals.l:56:9: error: expected identifier or '(' before '{' token
 {float} {printf("Float ");
         ^
literals.l:61:1: error: expected identifier or '(' before '{' token
 {bool} {printf("Boolean ");
 ^
literals.l:61:8: error: expected identifier or '(' before '{' token
 {bool} {printf("Boolean ");
        ^
literals.l:66:1: error: expected identifier or '(' before '%' token
 %union {
 ^
literals.l:71:1: error: expected identifier or '(' before '%' token
 %token <value> LITERAL
 ^
In file included from tokens.l:8:0:
identifier.l:1:1: error: expected identifier or '(' before '%' token
 %{
 ^
In file included from tokens.l:8:0:
identifier.l:40:5: error: 'a' undeclared here (not in a function)
 id [a-zA-Z_][a-zA-Z_0-9]*
     ^
identifier.l:40:7: error: 'zA' undeclared here (not in a function)
 id [a-zA-Z_][a-zA-Z_0-9]*
       ^
identifier.l:40:10: error: 'Z_' undeclared here (not in a function)
 id [a-zA-Z_][a-zA-Z_0-9]*
          ^
identifier.l:40:19: error: 'Z_0' undeclared here (not in a function)
 id [a-zA-Z_][a-zA-Z_0-9]*
                   ^
identifier.l:40:25: error: expected '=', ',', ';', 'asm' or '__attribute__' before '*' token
 id [a-zA-Z_][a-zA-Z_0-9]*
                         ^
identifier.l:49:1: error: expected identifier or '(' before '%' token
 %token <lexeme> ID
 ^
identifier.l:51:6: error: expected identifier or '(' before '{' token
 {id} {
      ^
identifier.l:58:1: error: expected identifier or '(' before '%' token
 %%
 ^
tokens.l: In function 'yylex':
tokens.l:18:1: error: expected expression before '<' token
 %token <lexeme> ID

请帮忙

Answer 1

Lex 和 Flex 不使用 C 预处理器预处理其输入，也不提供任何类似于预处理器的

#include

指令或 Python

import

语句的（完全不同）行为的机制。 Lex 及其类似工具要求将整个扫描仪定义呈现在单个输入文件中。

我尝试这样做

%{
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include "../yacc/grammer.tab.h";
#include "keywords.l"
#include "literals.l"
#include "identifier.l"
%}

但是在导入时，导入的文件被视为 C 文件而不是 .l 文件。

C 没有 Python 式的 import 功能。 C 预处理器具有外部文件包含功能，其语义有很大不同。

不管怎么说，Lex 是一个 C 代码生成器。

%{ ... %}

块内的任何内容都会逐字传送到输出 C 源文件。因此，你的

#include "keywords.l"

等等。根据 C 预处理器的语义，在 C 编译期间（而不是 Lex 扫描器生成）进行处理。结果是，C 编译器尝试将这些文件的内容解释为 C 源代码。

请帮忙

将所有 .l 文件合并为一个。当您这样做时，请注意输入的规则（中间）部分中的条目是顺序敏感的。这会对您产生影响，因为您的所有关键字也满足

id

的规则。

另请务必删除

yywrap()

的重复定义。整个扫描仪只能有一个。

使用多个 lex 文件并在执行时将其合并为一个

问题描述投票：0回答：1

1个回答

最新问题

使用多个 lex 文件并在执行时将其合并为一个

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1