编译原理2.3习题 语法制导分析[C++]

图源:文心一言

编译原理习题整理~🥝🥝

作为初学者的我,这些习题主要用于自我巩固。由于是自学,答案难免有误,非常欢迎各位小伙伴指正与讨论!👏💡

  • 第1版:自己的解题,与AI老师的判卷~🧩🧩

编辑:梅头脑🌸 

审核:文心一言

题源:龙书《编译原理》 Alfre V.Aho 等著  赵建华 等译


目录

🧵参考答案

🧵练习2.3.1

🧵练习2.3.2

🧵练习2.3.3

🧵练习2.3.4

🔚结语


🧵参考答案

🌸fool2fish (Zhouxuan Yang) 博文:dragon-book-exercise-answers - GitCode

🧵练习2.3.1

🧩题目

构建一个语法制导翻译方案,该方案把算术表达式从中缀表示方式翻译成运算符在运算分量之前的前缀表达方式。例如:-xy是表达式 x-y 的前缀表示法。给出输入 9-5+2 和 9-5*2 的注释分析树。

📇答题

  • 产生式
expr → expr { ("+" | "-") term }  
term → factor { ("*" | "/") factor }  
factor → "(" expr ")" | digit  
digit → "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9"
  • 语义规则
expr → {print ('+' | '-')} expr { ("+" | "-") term }  
term → {print ('*' | '/')} factor { ("*" | "/") factor }  
factor →  "(" expr ")" | {print ('digit')} digit  
digit → "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9"
  • 注释分析树(这个小问,好像找不到参考答案)

📇AI审核

1:我曾问过AI,它习惯将第一行写为expr → term { ("+" | "-") term },这实际与教材中书写的expr → expr { ("+" | "-") term }不同,为什么不写为后者呢?

  • 第一行产生式 expr → expr { ("+" | "-") term } ,。这种表示方法采用了左递归的形式,意味着一个表达式可以是一个更复杂的表达式后跟一个由加法或减法运算符和另一个项组成的序列。
  • 然而,左递归形式对于某些解析技术(如自顶向下的解析器,如递归下降解析器)来说可能会导致问题,因为它们可能无法有效地处理这种直接或间接的无限递归情况。为了避免这些问题,通常会使用等价的右递归形式来重写产生式,如下所示:
expr → term { ("+" | "-") term }
  • 在这个右递归版本中,expr 以一个 term 开始,后面可以跟零个或多个由加法或减法运算符和另一个 term 组成的序列。这种形式更适合于自顶向下的解析算法,因为它保证了解析过程在有限的步骤内会终止。
  • 在您提供的原始问题中,没有特别指明必须使用左递归还是右递归形式,因此两者在描述算术表达式的语法结构时都是有效的。但是,从实现解析器的角度来看,选择右递归形式通常是更可取的做法,因为它与更广泛使用的解析算法兼容
  • 因此,即使第一行写成 expr → expr { ("+" | "-") term } 在语法上是正确的,但考虑到解析器的实现,通常更倾向于使用右递归形式 expr → term { ("+" | "-") term }

📇知识扩展

  • 树是什么鬼,先序遍历又是什么鬼:🌸数据结构05:树与二叉树[C++]-CSDN博客
  • 中缀转后缀的C++代码:🌸数据结构03:栈、队列和数组-CSDN博客

🧵练习2.3.2

🧩题目

构建一个语法制导翻译方案,该方案把算术表达式从后缀表达式翻译成中缀表达式。给出输入 95-2* 和 95*2- 的注释分析树。

📇争议

  • 本题解题过程可能有误,可能的争议点如下,欢迎小伙伴指导与讨论~
  • 问题1:
    • 按照我看书的理解,表达式可能是这样的:
      • 产生式:expr → expr + term,这个用于描述中缀表达式;
      • 语义规则:expr = expr.t || term.t || '+',这个用于描述后缀表达式;
      • 语义动作:expr → expr + term {print('+')},这个用于将中缀表达式翻译为后缀,其中的{print('+')}除了输出‘+’号以外没有意义;
    • 那么后缀表达式:
      • 产生式可能是:expr → expr term + ,这个用于描述后缀表达式,这也是参考答案的写法;
      • 但是AI不同意,强烈不建议这样写,在AI的理解这个语句“expr → expr term +”不能被解析器正确解析,其余理由我贴到了答案后面;
      • 因此,目前还是按照中缀表达式书写的答案;虽然AI也不建议这样写,他认为没有什么作用,在真正的编译器设计中,print操作通常不会出现在文法产生式中,一个更实际的解决方案可能是编写一个解析器...
  • 问题2:
    • 除此以外:我的解法语法可能有问题,没有区分优先等级,且会非常随意地加很多括号给表达式;话说,这如果是算法题,答成这样一半分就没有了...
    • 答题后贴的参考答案避免了这个问题(答案链接已贴于文首),价值相对高一些~~

📇思路

  • 后缀表达式没有括号,按从左到右的顺序运算,运算符的优先级别是相等的(如果我没有记错的话),而转换为的中缀表达式可能有括号。例如执行"4 5 6 + *":
    • 读到 4,压入栈。
    • 读到 5,压入栈。
    • 读到 6,压入栈。此时栈中有三个操作数:4、5 和 6。
    • 读到 +,弹出 5 和 6,形成中缀子表达式 5 + 6,并将其作为一个整体结果(可能带有括号)暂存或输出。此时栈中应该只剩下 4
    • 读到 *,弹出 4 和刚才得到的中缀子表达式 5 + 6。形成最终的中缀表达式 4 * (5 + 6)

📇答题

  • 产生式
expr → expr { operator term }  
term → digit
digit → "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9"  
operator → "+" | "-" | "*" | "/"
  • 语义规则
expr → {print('(')} expr { operator{print('operator')} term } {print(')')}
term → digit | print('digit');
digit → "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9"  
operator → "+" | "-" | "*" | "/"

📇AI审核

1:我曾问过AI,它将后缀表达式的第一行写为expr → term { operator term },而非更符合后缀表达式形式的expr → term { term operator}呢?

  • 在后缀表达式(也称为逆波兰表示法)中,操作数(项,即term)位于操作符之前。因此,当我们将后缀表达式转换为其他形式(如中缀表达式)时,我们需要确保操作数的顺序正确。例如,在后缀表达式“3 4 +”中,加法操作符“+”位于操作数“3”和“4”之后。因此,在转换为中缀表达式时,我们需要将操作数重新排序为“3 + 4”,这正是“expr → term { operator term }”产生式所反映的结构。
  • 在文法定义中,“expr → term { operator term }”这样的产生式意味着表达式(expr)由一个项(term)开始,后面可能跟着一个或多个由操作符(operator)和另一个项(term)组成的序列。在后缀表达式中,操作符总是位于它操作的两个操作数之后。
  • 如果我们写成“expr → term { term operator }”,这实际上是不正确的,因为它暗示了操作符后面紧跟着的是另一个项,然后才是之前的项,这与后缀表达式的实际结构相反。简单来说,这个产生式错误地指示了解析器先去寻找一个项(term),然后去寻找另一个项,最后才去寻找操作符(operator)。这实际上与后缀表达式的结构不符,因为在后缀表达式中,操作符应该紧跟在它的操作数之后。。
  • 简而言之,正确的顺序“term operator term”反映了在后缀表达式中操作符位于两个操作数之后的事实,而错误的顺序“term term operator”则不符合这种结构。

📇参考答案

productions:

expr -> expr expr +| expr expr -| expr expr *| expr expr /| digit

 translation schemes:

expr -> expr {print("+")} expr +| expr {print("-")} expr -| {print("(")} expr {print(")*(")} expr {print(")")} *| {print("(")} expr {print(")/(")} expr {print(")")} /| digit {print(digit)}

 Another reference answer

E -> {print("(")} E {print(op)} E {print(")"}} op | digit {print(digit)}

🧵练习2.3.3

🧩题目

构建一个将整数翻译成罗马数字的语法制导方案。

📇思路

罗马数字的组合规则可以总结如下:

  1. 基本符号:罗马数字系统使用七个不同的符号来表示数值:I (1)、V (5)、X (10)、L (50)、C (100)、D (500) 和 M (1000)。

  2. 数值表示

    • IXC 和 M 可以被重复最多三次来表示它们的倍数(例如:II = 2, XXX = 30, CC = 200, 但 IIII 不是标准的表示法,应为 IV)。
    • VL 和 D 不可以被重复。
  3. 减法原则:当一个小数值的符号出现在一个较大数值的符号左边时,表示应从大数中减去小数(例如:IV = 4, IX = 9, XL = 40, XC = 90, CD = 400, CM = 900)。

  4. 加法原则:当一个小数值的符号出现在一个较大数值的符号右边时,或者相同数值的符号连续出现时,表示应将它们相加(例如:VI = 6, XI = 11, XX = 20, CCC = 300)。

  5. 避免重复四次:罗马数字中不会出现连续四个相同的符号(如 IIII 或 XXXX)。应使用减法原则来表示这些数值(如 IV 代替 IIIIXL 代替 XXXX)。

  6. 从左到右:罗马数字应从左到右按照上述规则进行解读。

  7. 千位以上的表示:千位以上的数字可以通过重复 M 来表示(例如:MM = 2000, MMM = 3000)。

  8. 组合顺序:在表示一个数时,应从最高位开始,逐步降低到最低位。例如,数字 1994 应表示为 MCMXCIV(1000 + (1000 - 100) + (100 - 10) + (5 - 1))。

  9. 零的表示:罗马数字系统中没有专门的符号来表示零。零值是通过省略相应的符号来表示的。

基于以上规则,一个更准确且简化的罗马数字文法可能是这样的;请注意,这个文法仍然不是完美的,因为它允许像 "IIII" 这样的非标准表示:

roman → thousand* hundred ten unit  
thousand → "M" {"M"}  
hundred → "CM" | "CD" | "C" {"C" | "CC" | "CCC"} | "D" {"C" | "CC" | "CCC"} | "M" {"CM" | "CD" | "C" {"C" | "CC" | "CCC"} | "D" {"C" | "CC" | "CCC"}}  
ten → "XC" | "XL" | "X" {"X" | "XX" | "XXX"} | "L" {"X" | "XX" | "XXX"} | "IX" | "IV" | "V" {"I" | "II" | "III"} | "I" {"X" | "V"}  
unit → "I" {"I" | "II" | "III"} | "IV" | "V" {"I" | "II" | "III"} | "VI" | "VII" | "VIII" | "IX"

📇答题

经过前3道题与AI无尽的争吵(具体来说,我对于语法学不明白,而AI觉得语法制导翻译方案不实用);因此,我们决定彻底摆烂,以下用C++代码解题(?):

#include <string> 
#include <iostream>
using namespace std;std::string intToRoman(int num) {std::string roman = "";std::string thousands[] = { "", "M", "MM", "MMM" };std::string hundreds[] = { "", "C", "CC", "CCC", "CD", "D", "DC", "DCC", "DCCC", "CM" };std::string tens[] = { "", "X", "XX", "XXX", "XL", "L", "LX", "LXX", "LXXX", "XC" };std::string ones[] = { "", "I", "II", "III", "IV", "V", "VI", "VII", "VIII", "IX" };// 千位  roman += thousands[num / 1000];num %= 1000;// 百位  roman += hundreds[num / 100];num %= 100;// 十位  roman += tens[num / 10];num %= 10;// 个位  roman += ones[num];return roman;
}int main() {int number = 0;cout << "请输入整数(0-3999):\t" ;cin >> number;string romanNumeral = intToRoman(number);cout << romanNumeral << std::endl;return 0;
}

🧵练习2.3.4

🧩题目

构建一个将罗马数字翻译成整数的语法制导方案。

📇答题

#include <iostream>  
#include <string>  
#include <unordered_map>  int romanToInt(std::string s) {std::unordered_map<char, int> romanValues = {{'I', 1},{'V', 5},{'X', 10},{'L', 50},{'C', 100},{'D', 500},{'M', 1000}};int result = 0;// 从左向右遍历字符串,取出第i个字符for (size_t i = 0; i < s.length(); ++i) {int value = romanValues[s[i]];// 若第i+1个字符存在,且第i个字符<第i+1个字符,则结果减去第i个字符的值(第3条,减法原则),反之,则增加第i个字符的值(第4条,加法原则)if (i + 1 < s.length() && value < romanValues[s[i + 1]]) {result -= value;}else {result += value;}}return result;
}int main() {std::string romanNumeral = "MMMDXLIX";int number = romanToInt(romanNumeral);std::cout << number << std::endl; // 输出: 3549  return 0;
}

🔚结语

博文到此结束,写得模糊或者有误之处,欢迎小伙伴留言讨论与批评,督促博主优化内容{例如有错误、难理解、不简洁、缺功能}等,博主会顶锅前来修改~~😶‍🌫️😶‍🌫️

我是梅头脑,本片博文若有帮助,欢迎小伙伴动动可爱的小手默默给个赞支持一下,感谢点赞小伙伴对于博主的支持~~🌟🌟

同系列的博文:🌸编译原理_梅头脑_的博客-CSDN博客

同博主的博文:🌸随笔03 笔记整理-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/427367.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring扩展点在微服务应用(待完善)

ApplicationListener扩展 nacos注册服务&#xff0c; 监听容器发布事件 # 容器发布事件 AbstractAutoServiceRegistration#onApplicationEvent # 接收事件吗&#xff0c;注册服务到nacos NacosServiceRegistry#register Lifecycle扩展 #订阅服务实例更改的事件 NamingService#…

go语言数组和切片

1. 数组Array Golang Array和以往认知的数组有很大不同。 1. 数组&#xff1a;是同一种数据类型的固定长度的序列。2. 数组定义&#xff1a;var a [len]int&#xff0c;比如&#xff1a;var a [5]int&#xff0c;数组长度必须是常量&#xff0c;且是类型的组成部分。一旦定义&…

设计模式: 装饰模式

文章目录 一、什么是装饰模式二、装饰模式的结构三、使用场景案例分析 一、什么是装饰模式 在不改变对象原有行为的基础上&#xff0c;动态的来为该对象绑定新的行为。 二、装饰模式的结构 装饰模式结构中主要包含如下角色&#xff1a; Component&#xff08;抽象部件&…

操作系统-虚拟机(传统计算机 虚拟机 两类VMM对比 指令等级 特权与敏感)

文章目录 传统计算机虚拟机VMM的对比支持虚拟化的CPU通常分更多指令等级&#xff08;特权 敏感&#xff09; 传统计算机 传统物理机只有一个操作系统 两个进程在一个操作系统上运行会存在一些隐患&#xff08;相互影响 争夺资源等&#xff09; 解决方法&#xff1a;如果各个进…

Docker部署

Docker简介 Docker是一个开源的容器引擎&#xff0c;它有助于更快地交付应用。 Docker可将应用程序和基础设施层隔离&#xff0c;并且能将基础设施当作程序一样进行管理。使用 Docker可更快地打包、测试以及部署应用程序&#xff0c;并可以缩短从编写到部署运行代码的周期。 &a…

HCIP 交换

拓扑图&IP划分如下&#xff1a; 第一步&#xff0c;配制VLAN LSW1&#xff0c;LSW2&LSW3同理 检测 LSW1 LSW2 测试

硬件之相机选型

1. 相机成像原理 相机成像原理如图所示&#xff1a; 注&#xff1a; 当物距为无穷远时&#xff0c;像距等于焦距&#xff0c;成像在焦平面上&#xff1b;当物距为无穷无与两倍焦距之间时&#xff0c;像距在焦距与两倍焦距之间&#xff0c;成缩小的实像&#xff1b;当物距等于两…

MySQL的主从复制

主从复制是指将主数据库的 DDL 和 DML 操作通过二进制日志传到从库服务器中&#xff0c;然后在从库上对这些日志重新执行&#xff08;也叫重做&#xff09;&#xff0c;从而使得从库和主库的数据保持同步。 MySQL支持一台主库同时向多台从库进行复制&#xff0c; 从库同时也可…

什么是JMeter?我们为什么要用JMeter做性能测试

什么是JMeter&#xff1f;我们为什么要用JMeter做性能测试 什么是JMeter&#xff1f;为什么选择JMeterJMeter的优点JMeter是如何工作的 什么是JMeter&#xff1f; Apache JMeter TM是纯Java开源软件&#xff0c;最初由Apache软件基金会的Stefano Mazzocchi开发&#xff0c;旨在…

使用模方时,使用手动备份功能恢复备份前的状态没有效果,是什么原因?

在使用备份恢复时&#xff0c;鼠标应点击在要恢复的瓦块上&#xff0c;再点击还原备份&#xff1b;见下图&#xff1a; 模方是一款针对实景三维模型的冗余碎片、水面残缺、道路不平、标牌破损、纹理拉伸模糊等共性问题研发的实景三维模型修复编辑软件。模方4.1新增自动单体化建…

【Web前端开发基础】前端基础布局之百分比布局、flex布局

前端基础布局 目录 前端基础布局布局简介盒模型1. 标准盒模型2. 怪异盒模型3. 解决方案4. 代码示例 常见的布局单位百分比布局flex布局一、Flex布局是什么&#xff1f;二、基本概念三、容器属性flex-direction属性&#xff1a;决定主轴的方向&#xff08;即项目的排列方向&…

SwiftUI 打造酷炫流光边框 + 微光滑动闪烁的 3D 透视滚动卡片墙

功能需求 有时候我们希望自己的 App 能向用户展示与众不同、富有创造力的酷炫视觉效果: 如上图所示,我们制作了一款流光边框 + 微光滑动闪烁的 3D 透视卡片滚动效果。这是怎么做到的呢? 在本篇博文中,您将学到以下内容 功能需求1. 3D 透视滚动2. 灵动边框流光效果3. 背景…