我正在尝试构建一个3地址码生成器,它将产生:
input:x=a+3*(b/7)
output: t1=b/7
t2=3*t1
t3=a+t2
x=t3
无论我作为输入提供了什么,输出都是“语法错误”.
我在用Windows 10。
Yacc代码:
%{
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#define YYDEBUG 1
int yylex(void);
int t_count = 1;
void yyerror(char *s)
{
fprintf(stderr,"%s\n",s);
return;
}
char * generateToken(int i)
{
char* ch=(char*)malloc(sizeof(char)*5);
sprintf(ch,"t%d",i++);
return ch;
}
%}
%union { double dval; char ivar[50]; }
%token <ivar> NUMBER
%token <ivar> NAME
%type <ivar> expr
%type <ivar> term
%left '+' '-'
%left '*' '/'
%left '(' ')'
%right '='
%%
program:
line {
}
| program line {
}
;
line:
expr '\n' {
t_count =1;
}
| NAME '=' expr '\n' {
printf("%s = %s", $3,$1);
t_count=1;
}
;
expr:
expr '+' expr {
strcpy($$,generateToken(t_count));
printf("%s = %s + %s",$$,$1,$3);
}
| expr '-' expr {
strcpy($$,generateToken(t_count));
printf("%s = %s - %s",$$,$1,$3);
}
| expr '*' expr {
strcpy($$,generateToken(t_count));
printf("%s = %s * %s",$$,$1,$3);
}
| expr '/' expr {
strcpy($$,generateToken(t_count));
printf("%s = %s / %s",$$,$1,$3);
}
| term {
strcpy($$, $1);
}
| '(' expr ')' {
strcpy($$,generateToken(t_count));
printf("%s =( %s )" ,$$,$2);
}
;
term:
NAME {
strcpy($$, $1);
}
| NUMBER {
strcpy($$, $1);
}
;
%%
int main(void)
{
if (getenv("YYDEBUG")) yydebug = 1;
yyparse();
return 0;
}
现行法代码:
%option noyywrap
%{
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include "threeAdd.tab.h"
void yyerror(char*);
extern YYSTYPE yylval;
%}
NAME [a-zA-Z]
DIGIT [0-9]+
NUMBER [-]?{DIGIT}+(\.{DIGIT}+)?
%%
[ \t]+ { }
{NUMBER}
{
strcpy(yylval.ivar,yytext);
return *yylval.ivar;
}
"+" {
return *yytext;
}
"-" {
return *yytext;
}
"*" {
return *yytext;
}
"/" {
return *yytext;
}
"=" {
return *yytext;
}
"(" {
return *yytext;
}
")" {
return *yytext;
}
{NAME} {
strcpy(yylval.ivar,yytext);
return *yylval.ivar;
}
"\n" {
return *yytext;
}
exit {
return 0;
}
. {
char msg[25];
sprintf(msg," <%s>","invalid character",yytext);
yyerror(msg);
}
%%
示例构建和运行:
C:\Users\USER\OneDrive\Desktop\Compiler\ICG>bison -d file.y
C:\Users\USER\OneDrive\Desktop\Compiler\ICG>gcc lev.yy.c file.tab.c -o ICG.exe ICG.exe 3+9
语法错误
发布于 2020-06-05 10:06:37
基本的问题是,您在yacc文件中对令牌使用双引号("
-字符串)(没有为它们定义任何代码,因此它们是无用的),并在您的lex文件中返回单个字符令牌。因此,解析器中不会识别任何标记。
将yacc文件中所有单个字符标记上的所有"
字符替换为'
字符(因此"+"
变为'+'
,"\n"
变为'\n'
)。
一旦修复了这个问题,就会遇到另一个问题:{DIGITS}+
和{NAME}
的lex规则不返回令牌,因此令牌将被忽略(导致语法错误)。
对于一般的调试解析器问题,在调用yyparse之前,通常需要使用-DYYDEBUG
进行编译并将yydebug = 1;
粘贴到main中,这将导致解析器打印所看到的标记和访问状态的跟踪。我经常把
if (getenv("YYDEBUG")) yydebug = 1;
进入main,然后放在这里--这样通常不会启用调试,但是如果在运行程序之前设置了环境变量YYDEBUG=1
,您将看到调试跟踪(不需要重新编译)。
为了返回令牌,您的lexer规则需要对令牌进行return
。因此,NUMBER
的lexer规则应该是:
{NUMBER} {
strcpy(yylval.ivar,yytext);
return NUMBER;
}
NAME
也是如此。注意,代码块的开头{
必须在与模式相同的行上--如果它位于单独的行上,它将不会与模式相关联。
https://stackoverflow.com/questions/62219262
复制相似问题