从0开始自制解释器——实现简单的加法计算器
创始人
2024-05-30 04:50:23
0

为什么要学习编译器和解释器呢?文中的作者给出的答案有下面几个:

  1. 为了深入理解计算机是如何工作的:一个显而易见的道理就是,如果你不懂编译器和解释器是如何工作的那么你就不明白计算机是如何工作的
  2. 编译器和解释器用到的一些原理和编程技巧以及算法在其他地方也可以用到。学习编译器和解释器能够学到并强化这些技巧的运用
  3. 为了方便日后能编写自己的编程语言或者专用领域的特殊语言

接下来我们就从0开始一步一步的构建自己的解释器。跟着教程先制作一个简单的加法计算器,为了保证简单,这个加法计算器能够解析的表达式需要满足下面几点:

  1. 目前只支持加法运算
  2. 目前只支持两个10以内的整数的计算
  3. 表达式之间不能有空格
  4. 只能计算一次加法

举一个例子来说,它可以计算诸如"1+2"、“5+6” 这样的表达式,但是不能计算像 “11+20”(必须是10以内)、“1.1+2”(需要两个数都是整数)、“1 + 2”(中间不能有空格)、“1+2+3”(只能计算一次加法)

有了这些限制,我们很容易就能实现出来。

实现的算法

假设我们要计算表达式 5+6。这里主要的步骤是通过字符串保存表达式,然后通过索引依次访问每个字符,分别找到两个整数和加法运算符,最后实现两个整数相加的操作。

第一步,我们的索引在表达式字符串的开始位置,解析得到当前位置的字符是一个整数,我们给它打上标记,类型为整形,值为5。
在这里插入图片描述

第二步,索引向前推进,解析当前位置的字符是一个+。还是给它打上标记,类型为plus,值为+
在这里插入图片描述

第三步,索引继续前进,解析到当前位置的字符是一个整数,我们给它打上标记,类型为整形,值为6
在这里插入图片描述

最后一步,根据得到的两个整数以及要执行的算术运算,我们将两个数直接进行相加得到最终结果

具体的代码

首先我们定义这个标记的类型,目前支持整数以及加法的标记

typedef enum e_TokenType
{CINT = 0, //整型PLUS //加法运算符
}ETokenType;// 这里因为只支持10以内的整数,所以表示计算数字的字符只有一个,加上字符串最后的结束标记,字符数组只需要两个即可
typedef struct Token
{ETokenType type; //类型char value[2]; //值
}Token, *LPTOKEN;

接着定义一些全局变量来保存算术运算的表达式和当前指针的索引

char* g_pszUserBuf = NULL;
char* g_pPosition = NULL;

接着我们定义一个函数来模拟上述说到的不断解析每一个字符的过程

bool get_next_token(LPTOKEN pToken)
{char* sz = g_pPosition;g_pPosition++;pToken->value[0] = '\0';if (*sz >= '0' && *sz <= '9'){pToken->type = CINT;pToken->value[0] = *sz;return true;}else if (*sz == '+'){pToken->type = PLUS;pToken->value[0] = *sz;return true;}else{pToken->value[0] = '\0';return false;}
}

最后我们定义一个函数来执行获取每个标记并最终计算结果的操作

int expr()
{int val1 = 0, val2 = 0;Token token = { 0 };if (get_next_token(&token) && token.type == CINT){val1 = atoi(token.value);}else{printf("首个字符必须是整数");return -1;}if (get_next_token(&token) && token.type == PLUS){}else{printf("第二个字符必须是操作符,并且当前只支持 + 运算");return -1;}if (get_next_token(&token) && token.type == CINT){val2 = atoi(token.value);}printf("%d+%d=%d\n", val1, val2, val1 + val2);
}

main函数里面我们只需要建立一个缓冲来保存字符,并且在循环中不断等待用户输入,完成解析并输出结果即可

// 重制当前解析环境
void reset()
{memset(g_pszUserBuf, 0x00, 16 * sizeof(char));scanf_s("%s", g_pszUserBuf);g_pPosition = g_pszUserBuf;
}int main()
{g_pszUserBuf = (char*)malloc(16 * sizeof(char));while (1){printf(">>>");reset();if (strcmp(g_pszUserBuf, "exit") == 0){break;}expr();}return 0;
}

最终执行的结果如下
在这里插入图片描述

最后的总结

程序我们已经写完了,你可能觉得这个程序太简单了,只能做这点事情。别着急,后面将会逐步的去完善这个程序。以便它能实现更加复杂的运算。

最后我们来引入一些概念性的东西:

  1. 我们将输入内容按照一定规则打上的标记被称之为Token
  2. 上述get_next_token函数体现的将一段字符串分割并打上有意义的标签的过程被称为词法分析。
  3. 解释器工作的第一步就是将输入的字符串按照一定的规则转换为一系列有意义的标记。完成这个工作的组件被称之为词法分析器,也可以被称为扫描器或者分词器

相关内容

热门资讯

s24evmonexe-S24... 嘿,你有没有试过那种感觉,就像电脑里的一个小程序,突然成了你心跳的加速器?S24EVMON.EXE,...
android基本组件-探索 ... 哎呀,说到Android的小家伙们,真是让人又爱又恨!每次打开手机,这些小家伙就在背后默默地工作,让...
克罗恩病护理诊断及护理措施-克... 哎呀,说到克罗恩病,这可是个让人头疼的小妖精。我得这病已经好几年了,每天都在和它斗智斗勇。今天,我得...
身份证号码大全及名字-身份证号... 哇塞,今天我要和大家爆一个大料,关于那些身份证号码和名字的秘密,简直是让人目瞪口呆!你以为身份证号码...
彩生活协同oa系统2.0-彩生... 大家好!今天我要来聊聊我们生活中的小帮手——彩生活协同OA系统2.0。这个系统真是太棒了,它不仅仅是...
twrp recovery怎么... 哎呀,说到TWRPRecovery,这可不是一般的玩意儿!如果你是个爱折腾手机的小能手,那你肯定得知...
急性阑尾炎术后的心理护理-急性... 哎呀,说到这急性阑尾炎手术后的日子,真是让人心疼又心累啊!手术刀一划,不仅切开了肚子,连带着把心情也...
gps相片转谷歌地球-首次将 ... 哎呀,你们知道吗?当我第一次尝试把我的GPS相片转到谷歌地球上时,我的心情简直不能更激动了!就像是小...
rallycross-拉力越野... 嗨,各位赛车迷们!今天咱们聊聊那个让人心跳加速、热血沸腾的赛事——拉力越野赛(Rallycross)...
朝阳市中心医院电话:救命稻草还... 哎呀,说到这个朝阳市中心医院电话,我可是有说不完的故事啊!每次一想到要拨打那个号码,心里就五味杂陈。...
免费图书管理系统百度云-免费图... 哎呀,说到这个免费图书管理系统在百度云上,我真的是激动得不行!你知道吗,作为一个书虫,家里的书多得跟...
ecshop模板家-ECSHO... 大家好,我是一个热爱网上购物的小店主,今天我要和大家聊聊我的“ECSHOP模板家”的奇妙冒险。ECS...
硬盘坏了,d盘消失了-电脑 D... 哎呀,真是气死我了!今天一打开电脑,准备追个剧呢,结果发现我的D盘不见了!那个装满了我多年珍藏的D盘...
2024r2联网激活-2024... 哎呀,说到这个2024R2的联网激活,我简直要激动得跳起来!这可不是一般的激活过程,简直就像是一场刺...
警惕!牛犇病毒肆虐网络,如何防... 哎呀,说到这个“牛犇病毒”,真是让人头疼啊!这玩意儿最近在网络上疯传,简直像是打开了潘多拉的盒子,搞...
戴尔台式机系统重装-戴尔台式机... 哎,最近我的戴尔台式机简直成了电影里的慢动作大师,点个图标能等我喝完一杯咖啡!这速度,简直比乌龟还慢...
达思数据恢复软件如何使用-达思... 大家好,我是一名普通的数据维护爱好者,今天我要跟大家聊聊一个超级神奇的工具——达思数据恢复软件!这东...
急性肺炎怎么治疗-急性肺炎不用... 哎呀,急性肺炎这事儿,真是让人心急火燎的!但别慌,我来给你支支招。首先啊,得了急性肺炎,最重要的是去...
道路绿化设计方案-城市道路绿化... 在这个快节奏的城市生活中,我们常常忽略了那些默默陪伴我们的绿色伙伴——道路两旁的绿化带。今天,我想和...
数组全部初始化为0-电脑数组一... 哎呀,天哪!今天早上打开电脑,发现我的数组全变成0了!这是怎么回事啊?昨天还好好的,怎么一觉醒来就全...