从0开始自制解释器——实现简单的加法计算器
创始人
2024-05-30 04:50:23
0

为什么要学习编译器和解释器呢?文中的作者给出的答案有下面几个:

  1. 为了深入理解计算机是如何工作的:一个显而易见的道理就是,如果你不懂编译器和解释器是如何工作的那么你就不明白计算机是如何工作的
  2. 编译器和解释器用到的一些原理和编程技巧以及算法在其他地方也可以用到。学习编译器和解释器能够学到并强化这些技巧的运用
  3. 为了方便日后能编写自己的编程语言或者专用领域的特殊语言

接下来我们就从0开始一步一步的构建自己的解释器。跟着教程先制作一个简单的加法计算器,为了保证简单,这个加法计算器能够解析的表达式需要满足下面几点:

  1. 目前只支持加法运算
  2. 目前只支持两个10以内的整数的计算
  3. 表达式之间不能有空格
  4. 只能计算一次加法

举一个例子来说,它可以计算诸如"1+2"、“5+6” 这样的表达式,但是不能计算像 “11+20”(必须是10以内)、“1.1+2”(需要两个数都是整数)、“1 + 2”(中间不能有空格)、“1+2+3”(只能计算一次加法)

有了这些限制,我们很容易就能实现出来。

实现的算法

假设我们要计算表达式 5+6。这里主要的步骤是通过字符串保存表达式,然后通过索引依次访问每个字符,分别找到两个整数和加法运算符,最后实现两个整数相加的操作。

第一步,我们的索引在表达式字符串的开始位置,解析得到当前位置的字符是一个整数,我们给它打上标记,类型为整形,值为5。
在这里插入图片描述

第二步,索引向前推进,解析当前位置的字符是一个+。还是给它打上标记,类型为plus,值为+
在这里插入图片描述

第三步,索引继续前进,解析到当前位置的字符是一个整数,我们给它打上标记,类型为整形,值为6
在这里插入图片描述

最后一步,根据得到的两个整数以及要执行的算术运算,我们将两个数直接进行相加得到最终结果

具体的代码

首先我们定义这个标记的类型,目前支持整数以及加法的标记

typedef enum e_TokenType
{CINT = 0, //整型PLUS //加法运算符
}ETokenType;// 这里因为只支持10以内的整数,所以表示计算数字的字符只有一个,加上字符串最后的结束标记,字符数组只需要两个即可
typedef struct Token
{ETokenType type; //类型char value[2]; //值
}Token, *LPTOKEN;

接着定义一些全局变量来保存算术运算的表达式和当前指针的索引

char* g_pszUserBuf = NULL;
char* g_pPosition = NULL;

接着我们定义一个函数来模拟上述说到的不断解析每一个字符的过程

bool get_next_token(LPTOKEN pToken)
{char* sz = g_pPosition;g_pPosition++;pToken->value[0] = '\0';if (*sz >= '0' && *sz <= '9'){pToken->type = CINT;pToken->value[0] = *sz;return true;}else if (*sz == '+'){pToken->type = PLUS;pToken->value[0] = *sz;return true;}else{pToken->value[0] = '\0';return false;}
}

最后我们定义一个函数来执行获取每个标记并最终计算结果的操作

int expr()
{int val1 = 0, val2 = 0;Token token = { 0 };if (get_next_token(&token) && token.type == CINT){val1 = atoi(token.value);}else{printf("首个字符必须是整数");return -1;}if (get_next_token(&token) && token.type == PLUS){}else{printf("第二个字符必须是操作符,并且当前只支持 + 运算");return -1;}if (get_next_token(&token) && token.type == CINT){val2 = atoi(token.value);}printf("%d+%d=%d\n", val1, val2, val1 + val2);
}

main函数里面我们只需要建立一个缓冲来保存字符,并且在循环中不断等待用户输入,完成解析并输出结果即可

// 重制当前解析环境
void reset()
{memset(g_pszUserBuf, 0x00, 16 * sizeof(char));scanf_s("%s", g_pszUserBuf);g_pPosition = g_pszUserBuf;
}int main()
{g_pszUserBuf = (char*)malloc(16 * sizeof(char));while (1){printf(">>>");reset();if (strcmp(g_pszUserBuf, "exit") == 0){break;}expr();}return 0;
}

最终执行的结果如下
在这里插入图片描述

最后的总结

程序我们已经写完了,你可能觉得这个程序太简单了,只能做这点事情。别着急,后面将会逐步的去完善这个程序。以便它能实现更加复杂的运算。

最后我们来引入一些概念性的东西:

  1. 我们将输入内容按照一定规则打上的标记被称之为Token
  2. 上述get_next_token函数体现的将一段字符串分割并打上有意义的标签的过程被称为词法分析。
  3. 解释器工作的第一步就是将输入的字符串按照一定的规则转换为一系列有意义的标记。完成这个工作的组件被称之为词法分析器,也可以被称为扫描器或者分词器

相关内容

热门资讯

122.(leaflet篇)l... 听老人家说:多看美女会长寿 地图之家总目录(订阅之前建议先查看该博客) 文章末尾处提供保证可运行...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
Vue使用pdf-lib为文件... 之前也写过两篇预览pdf的,但是没有加水印,这是链接:Vu...
PyQt5数据库开发1 4.1... 文章目录 前言 步骤/方法 1 使用windows身份登录 2 启用混合登录模式 3 允许远程连接服...
Android studio ... 解决 Android studio 出现“The emulator process for AVD ...
Linux基础命令大全(上) ♥️作者:小刘在C站 ♥️个人主页:小刘主页 ♥️每天分享云计算网络运维...
再谈解决“因为文件包含病毒或潜... 前面出了一篇博文专门来解决“因为文件包含病毒或潜在的垃圾软件”的问题,其中第二种方法有...
南京邮电大学通达学院2023c... 题目展示 一.问题描述 实验题目1 定义一个学生类,其中包括如下内容: (1)私有数据成员 ①年龄 ...
PageObject 六大原则 PageObject六大原则: 1.封装服务的方法 2.不要暴露页面的细节 3.通过r...
【Linux网络编程】01:S... Socket多进程 OVERVIEWSocket多进程1.Server2.Client3.bug&...
数据结构刷题(二十五):122... 1.122. 买卖股票的最佳时机 II思路:贪心。把利润分解为每天为单位的维度,然后收...
浏览器事件循环 事件循环 浏览器的进程模型 何为进程? 程序运行需要有它自己专属的内存空间࿰...
8个免费图片/照片压缩工具帮您... 继续查看一些最好的图像压缩工具,以提升用户体验和存储空间以及网站使用支持。 无数图像压...
计算机二级Python备考(2... 目录  一、选择题 1.在Python语言中: 2.知识点 二、基本操作题 1. j...
端电压 相电压 线电压 记得刚接触矢量控制的时候,拿到板子,就赶紧去测各种波形,结...
如何使用Python检测和识别... 车牌检测与识别技术用途广泛,可以用于道路系统、无票停车场、车辆门禁等。这项技术结合了计...
带环链表详解 目录 一、什么是环形链表 二、判断是否为环形链表 2.1 具体题目 2.2 具体思路 2.3 思路的...
【C语言进阶:刨根究底字符串函... 本节重点内容: 深入理解strcpy函数的使用学会strcpy函数的模拟实现⚡strc...
Django web开发(一)... 文章目录前端开发1.快速开发网站2.标签2.1 编码2.2 title2.3 标题2.4 div和s...