【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc

上传人:PIYPING 文档编号:10610327 上传时间:2021-05-25 格式:DOC 页数:80 大小:338.50KB
返回 下载 相关 举报
【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc_第1页
第1页 / 共80页
【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc_第2页
第2页 / 共80页
【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc_第3页
第3页 / 共80页
【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc_第4页
第4页 / 共80页
【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc》由会员分享,可在线阅读,更多相关《【精编完整版】C语言词法分析器和C-语言语法分析器编译原理毕业论文.doc(80页珍藏版)》请在三一文库上搜索。

1、(此文档为word格式,下载后您可任意编辑修改!)编译原理课程设计课程报告题目 C语言词法分析器和C-语言语法分析器 学生姓名 学生学号 指导教师 提交报告时间 2019 年 6 月 8 日C语言词法分析器1 实验目的及意义1. 熟悉C语言词法2. 掌握构造DFA的过程3. 掌握利用DFA实现C语言的词法分析器4. 理解编译器词法分析的工作原理2 词法特点及正则表达式2.1词法特点2.1.1 保留字AUTO, BREAK , CASE , CHAR , CONST , CONTINUE , DEFAULT , DO , DOUBLE , ELSE, ENUM , EXTERN , FLOAT

2、, FOR , GOTO, IF , INT , LONG , REGISTER , RETURN, SHORT , SIGNED , SIZEOF , STATIC , STRUCT , SWITCH , TYPEDEF , UNION , UNSIGNED , VOID, VOLATILE , WHILE,2.1.2 符号 + - * + - += -= *= = = != = ; , ( ) * * : 2.2 正则表达式 whitespace = (newline|blank|tab|comment)+ digit=0|.|9 nat=digit+ signedNat=(+|-)?na

3、t NUM=signedNat(“.”nat)? letter = a|.|z|A|.|Z ID = letter(letter|digit|“_”)+ CHAR = other+ STRING = “other+”3 Token定义3.1 token类型保留字auto break case char const continue default do double elseenum extern float for gotoif int long redisterreturnshort signed sizeof static struct switch typedef union unsi

4、gnedvoid volatile while特殊符号+ - * + - += -= *= = = != = ; , ( ) * * :文件结束、错误EOF ERROR其它tokenNUM ID CHARACTER STRING3.2 tokenType类型代码4 DFA设计4.1 注释的DFA设计注释的DFA如下所示,一共分为5个状态,在开始状态1时,如果输入的字符为,则进入状态2,此时有可能进入注释状态,如果在状态2时,输入的字符为*,则进入注释状态,状态将转到3,如果在状态3时,输入的字符为*,则有可能结束注释状态,此时状态将转到状态4,如果在状态4时输入的字符为,则注释状态结束,状态转

5、移到结束状态。4.2 词法分析的DFA设计词法分析的DFA如下所示,一共分为10个状态:START、INNUM、INNUM1、INNUM2、INID、INCOMPARE、INOPERATE、INSTRING、INCHAR、DONE。状态START表示开始状态,状态INNUM,INNUM1,INNUM2表示数字类型(NUM)Token的状态,状态INID表示标示符(ID)类型Token的状态,状态INOPERATE表示算数运算符型Token的状态,状态INOCOMPARE表示比较运算符型Token的状态,INSTRING表示字符串(STRING)类型Token的状态,INCHAR表示字符(CHA

6、RACTER)类型Token的状态,状态DONE表示接收状态。l 在开始状态START时 如果输入的字符为空白符,如空格换行等,则仍在START状态 如果输入的字符为digit,则进入状态INNUM,即可能是数字类型(NUM)Token的状态 如果输入的字符为letter,则进入状态INID,即可能是标识符类型Token的状态 如果输入的字符为、=2) b+=0.1 a+; 6.2 测试结果6.3结果分析test.c文件中包括注释,保留字,整数和小数,标识符,特殊符号,字符串以及错误输入。本程序成功对test.c文件进行了词法分析,对注释进行了忽略,输出了相应的行号、类型、取值,对于错误的输入

7、显示ERROR。7 小结通过编写C语言词法分析器,我对编译器的基本原理有了更深的认识,同时掌握了DFA的设计与实现。在最开始的编写过程中,我总是把词法和语法分析混淆,比如一些错误应该在语法分析中判断,我却写进了词法分析中,后来我逐步认识到词法分析的作用就是提取源代码中的Token。在DFA的实现过程中,我主要参考了书后tiny语言DFA的实现方法,将它扩展到C语言。另外C语言词法比较复杂,因为时间关系我省略了一些,比如位运算符,转义字符等等,希望今后能完善。C-语言语法分析器1 实验目的及意义用C语言编制TinyC-语言的语法分析程序,实现对词法分析程序所提供的Token序列的语法检查和结构分

8、析。 2 文法规则(EBNF)programdeclaration-listdeclaration_list declaration declaration declarationvar-declaration|fun-declarationvar_declaration type-specifier ID; | type-specifier ID NUM;type - specifier int | voidfun-declatationtype-specifier ID (params) | compound-stmtparamsparam_list | voidparam_listpar

9、am, paramparam type-specifier ID compound-stmt local-declaration statement-listlocal-declarations empty var- declarationstatement-liststatementstatementexpression-stmt | compound-stmt | selection-stmt | iteration-stmt | return-stmtexpression-stmt expression;selection-stmtif (expression) statement el

10、se statementiteration-stmtwhile (expression)statementreturn-stmtreturn expression;expression var = expression | simple-expressionrelop = | | = | = = | ! =varID | ID expressionsimple-expressionadditive-expression relop additive-expression additive-expressiontermaddop term addop + | -termfactormulop f

11、actor mulop * | factor(expression) | var | call | NUMcallID( args )argsarg-list | emptyarg-list expression, expression3 节点类型及定义3.1节点类型节点类型描述子节点IntKInt型变量或返回值无VoidKvoid型变量或返回值无IdK标示符id无ConstK数值无Var_DeclK变量声明变量类型+变量名Var_DeclK数组声明数组名+数组大小FunK函数声明返回类型+函数名+参数列表+函数体ParamsKFunK的参数列表参数(如果有多个参数,则之间为兄弟节点)Para

12、mKFunK的参数参数类型+参数名CompK复合语句体变量声明列表+语句列表Selection_StmtKif条件表达式+IF体+ELSE体Iteration_StmtKwhile条件表达式+循环体Return_StmtKreturn表达式AssignK赋值被赋值变量+赋值变量OpK运算运算符左值+运算符右值Arry_ElemK数组元素数组名+下标CallK函数调用函数名+参数列表ArgsKCallK的参数列表表达式UnkownK未知节点无3.2节点定义typedef struct treeNodestruct treeNode * child4;struct treeNode * sibli

13、ng;int lineno;NodeKind nodekind;union TokenType op; int val; const char * name; attr; ExpType type; TreeNode;4 代码结构分析文法programdeclaration-list分析函数TreeNode * parse(void)说明C-程序由一个声明序列组成,parse(void)函数首先执行getToken()然后直接调用declaration_list()返回树节点代码TreeNode * parse(void)TreeNode * t;token = getToken();t =

14、declaration_list();if(token!=ENDFILE) syntaxError(endfile error);return t;文法declaration_list declaration declaration 分析函数TreeNode * declaration_list(void)说明声明序列是由若干声明构成,declaration_list(void)函数中直接调用declaration()函数返回树节点,当前token为INT或VOID时,调用declaration()返回之前树节点的兄弟节点。代码TreeNode * declaration_list(void)

15、TreeNode * t = declaration();TreeNode * p =t;程序以变量声明开始 while(token!=INT)&(token!=VOID)&(token!=ENDFILE) syntaxError(开始不是类型声明); token = getToken(); if(token=ENDFILE) break; while(token=INT|token=VOID)TreeNode * q;q = declaration();if (q!=NULL)if (t=NULL)t=p=q;elsep-sibling=q;p=q;match(ENDFILE);return

16、 t;文法declarationvar-declaration|fun-declarationvar_declaration type-specifier ID; | type-specifier ID NUM;fun-declatationtype-specifier ID (params) | compound-stmt type-specifier int | void分析函数 TreeNode * declaration(void)说明首先判断类型,执行match函数, 匹配类型和ID,向前探测1个token的值确定是函数声明还是变量声明,如果token为,则是数组变量声明,返回节点A

17、rray_DeclK, token为(,则是函数声明,返回节点FunK, token为;则是普通变量声明,返回节点Var_DeclK代码TreeNode * declaration(void)TreeNode * t = NULL;TreeNode * p = NULL;TreeNode * q = NULL;TreeNode * s = NULL;TreeNode * a = NULL;if (token=INT)p=newNode(IntK);match(INT);else if (token=VOID)p=newNode(VoidK);match(VOID);else syntaxErr

18、or(type error);if(p!=NULL&token=ID)q = newNode(IdK);q-attr.name = copyString(tokenString); match(ID);if (token=LPAREN)t = newNode(FunK);t-child0 = p; p是t子节点t-child1 = q;match(LPAREN);t-child2 = params();match(RPAREN);t-child3 = compound_stmt();else if (token=LBRACKET)t = newNode(Var_DeclK);a = newNo

19、de(Arry_DeclK);t-child0 = p; p是t子节点t-child1 = a;match(LBRACKET);s = newNode(ConstK);s-attr.val = atoi(tokenString);match(NUM);a-child0=q;a-child1=s;match(RBRACKET);match(SEMI);else if (token=SEMI)t = newNode(Var_DeclK);t-child0 = p;t-child1 = q;match(SEMI);elsesyntaxError();elsesyntaxError();return

20、t;文法paramsparam_list | void分析函数TreeNode * params(void)说明参数列表,根节点ParamsK,首先判断token是否是VOID,如果是VOID则匹配,判断下一个token,如果是右括号,则参数列表中只有子节点VoidK,如果是ID,则子节点是param_list,如果开始时token是INT,则参数列表子节点是param_list代码TreeNode * params(void)TreeNode * t = newNode(ParamsK);TreeNode * p = NULL;if (token=VOID)p = newNode(VoidK

21、);match(VOID);if (token=RPAREN)if(t!=NULL)t-child0 = p;else参数列表为(void id,) t-child0 = param_list(p);else if (token=INT)t-child0 = param_list(p);else syntaxError();return t;文法param_listparam, param分析函数TreeNode * param_list(TreeNode * k)说明说明参数列表由param序列组成,并由逗号隔开。param_list(TreeNode * k)函数使用递归向下分析方法直接调

22、用param(TreeNode * k)函数,并返回树节点代码TreeNode * param_list(TreeNode * k)TreeNode * t = param(k);TreeNode * p = t; k = NULL;没有要传给param的VoidK,所以将k设为NULLwhile (token=COMMA)TreeNode * q = NULL;match(COMMA);q = param(k);if (q!=NULL)if (t=NULL)t=p=q;elsep-sibling = q;p = q;return t;文法param type-specifier ID 分析函

23、数TreeNode * param(TreeNode * k)说明探测token是INT还是VOID,决定子节点类型是IntK还是VoidK,IdK作为第二个子节点,向前探测一个token,如果是左中括号,则产生第三个子节点代码TreeNode * param(TreeNode * k)TreeNode * t = newNode(ParamK);TreeNode * p = NULL;TreeNode * q = NULL;if(k=NULL&token=VOID)p = newNode(VoidK);match(VOID);else if(k=NULL&token=INT)p = newN

24、ode(IntK);match(INT);else if (k!=NULL)p = k;if(p!=NULL)t-child0 = p;if (token=ID)q = newNode(IdK);q-attr.name = copyString(tokenString);t-child1 = q;match(ID);elsesyntaxError();if (token=LBRACKET&(t-child1!=NULL)match(LBRACKET);t-child2 = newNode(IdK);match(RBRACKET);else return t; else syntaxError(

25、);return t;文法compound-stmt local-declaration statement-list分析函数TreeNode * compound_stmt(void)说明复合语句,直接调用local_declaration()函数和statement_list()函数,产生两个子节点代码TreeNode * compound_stmt(void) TreeNode * t = newNode(CompK);match(LCBRACKET);t-child0 = local_declaration();t-child1 = statement_list(); match(RC

26、BRACKET);return t;文法local-declarations empty var- declaration分析函数TreeNode * local_declaration(void)说明全局变量声明,可以是空,也可以是若干变量声明,首先判断token是否等于INT或VOID,从而得知是否为空,若不为空则创建一个Var_DeclK节点代码TreeNode * local_declaration(void) TreeNode * t = NULL;TreeNode * q = NULL;TreeNode * p = NULL;while(token=INT | token=VOID

27、) p = newNode(Var_DeclK);if(token=INT)TreeNode * q1 = newNode(IntK);p-child0 = q1;match(INT);else if(token=VOID)TreeNode * q1 = newNode(VoidK);p-child0 = q1;match(INT);if(p!=NULL)&(token=ID) TreeNode * q2 = newNode(IdK); q2-attr.name = copyString(tokenString);p-child1 = q2;match(ID);if(token=LBRACKE

28、T) TreeNode * q3 = newNode(Var_DeclK);p-child3 = q3;match(LBRACKET);match(RBRACKET);match(SEMI);else if(token=SEMI)match(SEMI);elsematch(SEMI); else syntaxError();if(p!=NULL)if(t=NULL)t = q = p;elseq-sibling = p;q = p;return t;文法statement-liststatement分析函数TreeNode * statement_list(void)说明调用statement

29、()创建根节点,向前探测一个token,创建兄弟节点代码TreeNode * statement_list(void) TreeNode * t = statement(); TreeNode * p = t;while (IF=token | LCBRACKET=token | ID=token | WHILE=token | RETURN =token | SEMI=token | LPAREN=token | NUM=token) TreeNode * q;q = statement();if(q!=NULL)if(t=NULL) t = p = q;else p-sibling = q

30、;p = q;return t;文法statementexpression-stmt| compound-stmt | selection-stmt | iteration-stmt | return-stmt分析函数TreeNode * statement(void)说明statement由表达式或复合语句或if语句或while语句或return语句构成。statement(void)函数通过判断先行Token类型确定到底是哪一种类型。如果是IF则调用selection_statement(),如果是WHILE,则调用iteration_stmt(),如果是RETURN,则调用return(

31、),如果是左大括号,则是复合语句类型,如果是ID、SEMI、LPAREN、NUM,则是表达式语句类型代码TreeNode * statement(void) TreeNode * t = NULL;switch(token)case IF:t = selection_stmt(); break;case WHILE:t = iteration_stmt(); break;case RETURN:t = return_stmt(); break;case LCBRACKET:t = compound_stmt(); break;case ID: case SEMI: case LPAREN: case NUM: t = expression_stmt(); break;default:sy

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1