【编译原理-实验-2】预测分析表一篇解决你所有问题(c++版)
python版本(词法分析器整合预测分析表):
编译原理预测分析表一篇解决你所有问题(python版)
实验 预测分析表方法
一、实验目的
理解预测分析表方法的实现原理。
二、实验内容
编写一通用的预测法分析程序,要求有一定的错误处理能力,出错后能够使程序继续运行下去,直到分析过程结束。可通过不同的文法(通过数据表现)进行测试。
三、实验内容提示
1.算法数据构造:
构造终结符数组:char Vt[10][5]={“id”,”+”……};
构造非终结符数组:char Vn[10]={ };
构造follow集数组:char *follow[10][10]={ } (可将follow集与预测分析表合并存放,可省略,直接给出分析表。)
数据构造示例(使用的预测分析表构造方法1):
/*data1.h简单算术表达式数据*/
char VN[10][5]={"E","E'","T","T'","F"}; //非终结符表
int length_vn=5; //非终结符的个数
char VT[15][5]={"id","+","*","(",")","#"}; //终结符表
int length_vt=6; //终结符的个数
char Fa[15][10]={"TE'","+TE'","","FT'","*FT'","","(E)","id"};
//产生式表:E->TE' 1:E'->+TE' 2:E'->空
// 3:T->FT' 4:T'->*FT' 5:T'->空 6:F->(E) 7:F->id
int analysis_table[10][11]={0,-1,-1,0,-2,-2,0,0,0,0,0,
-1,1,-1,-1,2,2,0,0,0,0,0,
3,-2,-1,3,-2,-2,0,0,0,0,0,
-1,5, 4,-1,5, 5,0,0,0,0,0,
7,-2,-2,6,-2,-2,0,0,0,0,0};
//预测分析表,-1表示出错,-2表示该行终结符的follow集合,用于错误处理
(1) 预测分析表的构造方法1
给文法的正规式编号:存放在字符数组中,从0开始编号,正规式的编号即为该正规式在数组中对应的下标。
构造正规式数组:char P[10][10]={“E->TE’”,”E’->+TE’”,………}; (正规式可只存储右半部分,如E->TE’可存储为TE’ ,正规式中的符号可替换,如可将E’改为M )
构造预测分析表:int analyze_table[10][10]={ } //数组元素值存放正规式的编号,-1表示出错
(2)预测分析表的构造方法2
可使用三维数组
Char analyze_table[10][10][10]={ }
或
Char *analyze_table[10][10][10]={ }
2.针对预测分析表构造方法1的查找方法提示:
(1) 查非终结符表得到非终结符的序号no1
(2) 查终结符表得到终结符的序号no2
(3) 根据no1和no2查正规式表得到对应正规式的序号no3=analyze_table[no1][no2] ,如果no3=-1 表示出错。
(4) 根据no3查找对应的正规式P[no3]
(5) 对正规式进行处理
3.错误处理机制
紧急方式的错误恢复方法(抛弃某些符号,继续向下分析)
(1)栈顶为非终结符A,串中当前单词属于FOLLOW(A),则从栈中弹出A(此时可认为输入串中缺少A表示的结构),继续分析。 ---------错误编号为1
(2)栈顶为非终结符A,串中当前单词不属于FOLLOW(A),则可使串指针下移一个位置(认为输入串中当前单词多余),继续分析。----------错误编号为2
(3)栈顶为终结符,且不等于串中当前单词,则从栈中弹出此终结符(认为输入串中缺少当前单词)或者将串指针下移一个位置(认为串中当前单词多余)。在程序中可选择上述两种 观点中的一种进行处理。-------------错误编号3
因此error()函数的编写方式可按如下方式处理
Error(int errornum)
{
If(errornum==1)………………
Else if(errornum==2)……………
Else ………………..
//或者可用choose case语句处理
}
4.增加了错误处理的预测分析程序预测分析程序的算法:
将“#”和文法开始符依次压入栈中;
把第一个输入符号读入a;
do{
把栈顶符号弹出并放入x中;
if(x∈VT)
{
if(x==a) 将下一输入符号读入a;
else error(3 );
}
else
if(M[x,a]=“x→y1y2…yk”)
{
按逆序依次把yk、yk−1、…、y1压入栈中;
输出“x→y1y2…yk”;
}
else if afollow(x)error(1 ); else error(2);
}while(x!=“#”)
三.实验要求
给定算术表达式文法,编写程序。
测试数据:
1.算术表达式文法
E→TE’
E’ → +TE’|- TE’|ε
T→FT’
T’ →*FT’ |/ FT’ |%FT’|ε
F→(E) |id|num
给定一符合该文法的句子,如id+id*id#,运行预测分析程序,给出分析过程和每一步的分析结果。
输出形式参考下图:
四、编写实验报告
实验分析:
1.将原算术表达式方法改写为LL(1)文法为:
E→TE’
E’ → +TE’|- TE’|ε
T→FT’
T’ →*FT’ |/ FT’ |%FT’|ε
F→(E) |id|num
2.求出每个非终结符的FIRST和FOLLOW集;
非终结符 | FIRET | FOLLOW |
---|---|---|
E | { (,id,num } | { #,) } |
E’ | { +,-,ε } | { #,) } |
T | {(,id,num} | { +,-,#,) } |
T’ | { *,/,%,ε } | { +,-,#,) } |
F | { (,id,num } | { *,/,%,+,-,# ,)} |
3.构造预测分析表
坐标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
非\终结符 | * | / | % | + | - | ( | ) | id | num | # |
0 E | error(2) | error(2) | error(2) | error(2) | error(2) | E→ TE’ | error(1) | E→ TE’ | E→ TE’ | error(1) |
1 E’ | error(2) | error(2) | error(2) | E’ → +TE’ | E’ → -TE’ | error(2) | E’ → ε | error(2) | error(2) | E’ → ε |
2 T | error(2) | error(2) | error(2) | error(1) | error(1) | T→FT’ | error(1) | T→FT’ | T→FT’ | error(1) |
3 T’ | T’ →*FT’ | T’ →/FT’ | T’ →%FT’ | T’ →ε | T’ →ε | error(2) | T’ →ε | error(2) | error(2) | T’ →ε |
4 F | error(1) | error(1) | error(1) | error(1) | error(1) | F→(E) | error(1) | F→id | F→num | error(1) |
4.绘制编程流程图
5.c++代码实现
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include<iostream>
using namespace std;
#define TT 0
char aa[20]=" ";//用来存储从txt文件中读取的字符串
int pp=0;//用来标记字符
char VN[5]={'E','e','T','t','F'}; // 非终结符表
int length_vn=5; //非终结符的个数
char VT[10]={'*','l','m','+','-','(',')','i','n','#'}; //终结符表 l->/ m->% i->id n->num
int length_vt=10; // 终结符的个数
char Fa[12][6]={"Te","+Te","-Te","NULL","Ft","*Ft","nFt","mFt","NULL","(E)","i","n"};
//产生式表 :0:E->Te 1:e->+Te 2:e->-Te 3:e->空
char F[12][6]={"E->","E'->","E'->","E'->","T->","T'->","T'->","T'->","T'->","F->","F->","F->"};
//构造预测分析表,-1表示出错,-2表示该行终结符的follow集合,用于错误处理
int analysis_table[5][10]={
-2,-2,-2,-2,-2,0,-1,0,0,-1,
-2,-2,-2,1,2,-2,3,-2,-2,3,
-2,-2,-2,-1,-1,4,-1,4,4,-1,
5,6,7,8,8,-2,8,-2,-2,8,
-1,-1,-1,-1,-1,9,-1,10,11,-1};
char stack[50];
int top=-1;
// 程序初始化:输入并打开源程序文件
void initscanner()
{
int i=0;
FILE *fp;
if((fp=fopen("a.txt","r"))==NULL){
printf("Open error!");
exit(0);
}
char ch=fgetc(fp);
while(ch!=EOF){
aa[i]=ch;//将字符依次存入aa数组
i++;
ch=fgetc(fp);
}
fclose(fp);
}
//字符入栈
void push(char a)
{
top++;
stack[top]=a;
}
//字符出栈 ,弹出栈顶元素
char pop()
{
return stack[top--];
}
//字符x是否是终结符
int includevt(char x)
{
for(int i=0;i<length_vt;i++)
{
if(VT[i]==x) return 1;
}
return 0;
}
//查找非终结符,终结符 在预测分析表中的坐标,返回坐标对应信息
int includean(char x,char a)
{
int i,j;
//非终结符
for(i=0;i<length_vn;i++)
if(VN[i]==x) break;
//终结符
for(j=0;j<length_vt;j++)
if(VT[j]==a) break;
return analysis_table[i][j];
}
void destory()
{
int flag=0;
int flagg=0;
push('#'); //将 "#"和文法开始符依次压入栈中
push(VN[0]);//将第一个非终结符入栈
char a =aa[pp]; //把第一个输入符号读入 a,aa
char x;
//错误处理机制
do{
// printf("%s\t\t",stack);
if(flag==0)
x=pop(); //把栈顶符号弹出并放入 x 中
flag=0;
printf("%c\t\t\t\t%c\t\t",x,a);
//如果a是终结符
if(includevt(a)==1)
{
if(includevt(x)==1)
{
if(x==a)
{
if(a=='#')
{
flagg=1;
printf(" 结束 \n");
}
else printf(" 匹配终结符 %c\n",x);
pp++;
a=aa[pp]; //将下一输入符号读入 a;
}
else
{
flag=1;
printf(" 出错 ,跳过 %c\n",a);
pp++;
a=aa[pp];
}
}
//存在该表达式
else if(includean(x,a)>=0)
{
//获取分析表对应坐标数据
int h=includean(x,a);
printf(" 展开非终结符 %s%s\n",F[h],Fa[h]);
int k;
for(k=0;k<10;k++)
if(Fa[h][k]=='\0')
break;
if(k==4)
{
//printf("+++++++++++pop %c \n",x);
}
else
{
while(k!=0) //按逆序依次把 yk、yk?1、 , 、 y1 压入栈中
{
k--;
push(Fa[h][k]);
}
}
}
//-1表示出错
else if(includean(x,a)==-1)
{
flag=1;
printf(" 出错 ,从栈顶弹出 %c\n",x);
x=pop();
}
//
else
{
flag=1;
printf(" 出错 ,跳过 %c\n",a);
pp++;
a=aa[pp];
}
}
else
{
flag=1;
printf(" 出错 ,跳过 %c\n",a);
pp++;
a=aa[pp];
}
}while(x!='#');
if(flagg==0)
{
printf("%c\t\t\t%c\t",x,a);
printf(" 结束 \n");
}
}
int main()
{
printf(" 语法分析工程如下 :\n");
initscanner();
cout<<"-----------------文法如下---------------------"<<endl;
cout<<"E->TE'"<<endl;
cout<<"E'->+TE'|-TE'|~"<<endl;
cout<<"T->FT'"<<endl;
cout<<"T'->*FT'|/FT'|%FT'|~"<<endl;
cout<<"F->(E)|id|num"<<endl;
printf(" 要分析的语句是 :%s\n",aa);
printf(" 语法分析工程如下 :\n");
printf("栈顶元素 \t\t 当前单词记号 \t\t 动作 \n");
printf("--------------------------------------------------------------------\n");
destory();
return 0;
}
6.测试结果展示
7.不足分析
实验还存在一定的不足,相信一些同学通过对比测试结果会发现,与实验要求存在不小的差别,
首先<mark>栈顶元素</mark>输出的时候,没有输出T‘,取而带之的是小写的t,这里主要区别是前者是两个字符,后者是一个字符,相比易两个字符,一个字符在进行字符读取时更好处理,比如说在倒序入栈时,两个字符由于可以分割,进入栈中时就变成了’T,这样就导致了程序混乱。
还有不同的地方<mark>当前单词记号</mark>实验要求输出的时id,而我输出的时i,这里也是遇到了逆序入栈的问题,多于一个字符串,就会导致入栈出错,这里我想到了解决办法,这就需要于词法分析器联合使用,词法分析器将单词分析出来,然后再进行处理。
再然后就是<mark>动作</mark>动作中由于id是两个字符,所以在进行处理时,识别了i,但是在识别d是,发现终结符中不存在该字符,导致程序出错,识别不出,跳过。这个问题的解决方式也和上一个是一样的,利用词法分析,将语句进行词法分析。再进行处理,就不会出错了。
实验算是完成了,但是还有许多不足,下一篇文章将用python再做一遍,python相对于c++更易操作,对字符串的处理更加宽松灵活,好了,做完后我会把python版连接分享到这里。
最后!!!
<mark>欢迎点赞,关注</mark>