05 Machine-Level Representation of Programs
创始人
2025-05-29 13:20:00
0

既然 complier 能帮助我们将 code 转换为 low-level language 我们为什么还要学习呢?

  • By invoking the compliler with appropriate command-line parameters(通过使用适当的命令行参数调用编译器)
    编译器将生成一个以汇编代码形式显示其输出的文件
  • 通过阅读代码,我们可以了解编译器的优化功能,并分析代码中潜在的低效率

程序员学习机器代码的需求已经转变为阅读和理解编译器生成的代码。

读汇编的过程实际上是一个 a form of reverse engineering(逆向工程的一种形式)----->试着通过研究系统和向后工作来理解系统创建的过程

  • 项目的展示基于 X86-64:一台32位的机器只能使用大约4gb(2^32)位的随机存取存储器

3.2 Program Encodings

当我们写完 c program 我们可以compile通过
linux> gcc -Og -o p p1.c p2.c

  • -Og表示编译器应用一定级别的优化,生成遵循原始C代码整体结构的机器代码
  • 当然优化程度越高, C代码和汇编的差距越大,因此采用不那么大的 -Og 来进行学习

3.2.1 Machine-Level Code

计算机系统有两种重要的抽象

第一种 指令集: 机器级程序的格式和行为由指令集体系结构(ISA)定义
(1)描述处理器状态
(2)指令的格式
(3)每条指令执行之后的status

第二种 Virtual Memory(虚拟内存)
一些在C代码中隐藏的细节,可以在汇编代码中看到
(1)program counter(计数器)在x86-64中被叫做 %rip
(2)integer registee file(整数注册文件):可以存储 地址/指针;integer data;存储某些程序重要状态
(3)Condition Code Registers(条件代码寄存器):实现对于不同指令状态的记录, 比如跳转啥的
(4)A set of vector registers 存储 interger / floating point: 一组整数/浮点数向量寄存器

3.2.2 Code Examples

linux> gcc -OG -S mstore.c
-S:表明告诉编译器 to generate assembly file and go no further(以生成程序集文件,并没有进一步)
long mult2(long, long);void multstore(long x, long y, long* dest){long t = mult2(x, y);*dest = t;
}

assembly:

mulstore:pushq %rbx			//将rbx中内容 push 到 program stackmovq %rdx, %rbxcall mult2moveq %rax, (%rbx)popq %rbxret

如果我们选择了

linux> gcc -Og -c mstore.c

这样会generate an object-codee file mstore.c:

类似
53 48 86 d3 e8 00 00 00 00 48 5b c3

想知道binary code 代表什么意思,可以使用disassemblers
linux 系统中有 OBJDUMP 可以 实现
linux> objdump -d mstore.c
在这里插入图片描述

对于机器表示的内容

  • X86-64 指令集 每条指令 1-15个 bytes
    一般来说 操作数越多,指令bytes越多
  • 每个指令都是 prefix-free, 类似霍夫曼coding
    从给定的起始位置开始,有一个唯一的字节解码成机器指令
    比如 只有 pushq %rbx can start with byte value 53
    在这里插入图片描述

Notes on Formatting

一般我们采用
linux> gcc -Og -S mstore.c
在这里插入图片描述

Data Formats

由于历史设计的原因

Intel uses “word” to descript 16-bit data type

  • 32-bit 被叫做 double word
  • 64 bit quad words
  • X86家族中 Microprocessors (微处理器)实现了 all floating-point operations with a special 80-bit floating-point format(所有具有特殊80位浮点格式的浮点操作)
  • 大多数的 assembly-code (汇编代码)通过后缀表明到底操作的是 什么 word
    (1)movb (move byte)
    (2)movw(move word)
    (3)movl(move double word)
    (4)movq(move quad word)

Accessing Information(访问信息)

X86-64 CPU 包含了 16个 64位 寄存器

  • used to store integer data as well as pointer(用于存储整数数据和指针+
  • Byte-level operations can access the least significant byte(字节级操作可以访问最不重要的字节)
  • 16-bit operations can access the least significant 2 bytes(16位操作可以访问最不重要的2个字节)
  • 32-bit operations can access the least significant 4 bytes(32位操作可以访问最不重要的4个字节)
  • 64-bit operations can access the whole register(64位操作可以访问整个寄存器)
    在这里插入图片描述

3.4.1Operand Specifiers操作数说明符

在这里插入图片描述
指令中几种不同的操作数:

  • immediate -> constant values $577
  • register --> $5
  • memory reference(内存引用):
    (1)因为我们认为内存是一个巨大的数组
    (2)我们采用数组形式access:Mb[Addr] 表示 a reference to the b-byte value store in memory starting at address

为啥要有这么复杂的 内存reference格式?
它们在引用数组和结构元素时非常有用

3.4.2 Data Movement Instructions(数据移动说明)

Move class, 最简单的形式, 就是从一个地方拷贝到另外一个地方
在这里插入图片描述
在这里插入图片描述

注意这个图片, 如果 move bytes 那么只动后面两个
在这里插入图片描述

MOVZ class 会将dest 的剩余数字全部填充为 0
MOVS class 会将剩下的数字填充 based on sign extension
在这里插入图片描述

Data Movement Example

C code

long exchange(long* xp, long y){long x = *xp;*xp = y;return x;
}

Assembly Code

在这里插入图片描述
对上述code进行两点剖析

  • 在 C中的pointer 实际上 deferencing a pointer involves
    (1)Copying that pointer into a register(将该指针复制到寄 存器中)
    (2)use this register in a memory reference(在内存引用中使用此寄存器)

  • local variables such as X are often kept in registers rathre than stored in memory locations(局部变量(如X)通常保存在寄存器中,而不是存储在内存中)
    (1)因为 Register Access 通常比 Memory Locations 快很多

Pushing and Poping Data

The stack plays a vital role in the handling of procedure calls(堆栈在过程调用的处理中起着至关重要的作用)
在这里插入图片描述
在这里插入图片描述

注意:

  • push操作涉及堆栈指针的递减
    (1)实际上分两步, 第一步:堆栈指针减8
    (2)然后在策略地址的新顶部写入值
  • pop包括从内存中读取和堆栈指针的增量

pushq % rbp 和 下面两步相同
在这里插入图片描述
popq %rax 和下面两步相同
在这里插入图片描述

3.5 Arithmetic and Logical Operations(算术和逻辑运算)

蛮多汇编指令有 variant (变体)在 word size 比如:

  • addb
  • addw
  • addl
  • addq
    在这里插入图片描述

3.5.1 Load 指令

当然load指令也有一些用处 当实施简单的加减法

long scale(long x, long y, long z){long t = x + 4 * y + 12 * z;return t;
}

在这里插入图片描述

3.5.2 Unary and Binary Operations(一元运算和二元运算)

第二组指令是 只有一个操作数 的指令

  • 这个操作数可以是一个寄存器,也可以是一个内存位置

incq(%rsp) //这条指令让 stack 顶的元素 + 1

类似与x ++,y –

第三组指令是

subq %rax, %rdx
实际上的作用是 %rdx - %rax
英文语义是 subtract %rax from %rdx

同时对于 MOV 指令来说, 两个 oprand 不能同时是 memory location

  • 如果 destination 是 memory 那么处理器必须从内存中读取值,执行操作,然后将结果写回内存

3.5.3 Shift Operations(移位操作)

在这里插入图片描述

相关内容

热门资讯

电视安卓系统哪个品牌好,哪家品... 你有没有想过,家里的电视是不是该升级换代了呢?现在市面上电视品牌琳琅满目,各种操作系统也是让人眼花缭...
安卓会员管理系统怎么用,提升服... 你有没有想过,手机里那些你爱不释手的APP,背后其实有个强大的会员管理系统在默默支持呢?没错,就是那...
安卓系统软件使用技巧,解锁软件... 你有没有发现,用安卓手机的时候,总有一些小技巧能让你玩得更溜?别小看了这些小细节,它们可是能让你的手...
安卓系统提示音替换 你知道吗?手机里那个时不时响起的提示音,有时候真的能让人心情大好,有时候又让人抓狂不已。今天,就让我...
安卓开机不了系统更新 手机突然开不了机,系统更新还卡在那里,这可真是让人头疼的问题啊!你是不是也遇到了这种情况?别急,今天...
安卓系统中微信视频,安卓系统下... 你有没有发现,现在用手机聊天,视频通话简直成了标配!尤其是咱们安卓系统的小伙伴们,微信视频功能更是用...
安卓系统是服务器,服务器端的智... 你知道吗?在科技的世界里,安卓系统可是个超级明星呢!它不仅仅是个手机操作系统,竟然还能成为服务器的得...
pc电脑安卓系统下载软件,轻松... 你有没有想过,你的PC电脑上安装了安卓系统,是不是瞬间觉得世界都大不一样了呢?没错,就是那种“一机在...
电影院购票系统安卓,便捷观影新... 你有没有想过,在繁忙的生活中,一部好电影就像是一剂强心针,能瞬间让你放松心情?而我今天要和你分享的,...
安卓系统可以写程序? 你有没有想过,安卓系统竟然也能写程序呢?没错,你没听错!这个我们日常使用的智能手机操作系统,竟然有着...
安卓系统架构书籍推荐,权威书籍... 你有没有想过,想要深入了解安卓系统架构,却不知道从何下手?别急,今天我就要给你推荐几本超级实用的书籍...
安卓系统看到的炸弹,技术解析与... 安卓系统看到的炸弹——揭秘手机中的隐形威胁在数字化时代,智能手机已经成为我们生活中不可或缺的一部分。...
鸿蒙系统有安卓文件,畅享多平台... 你知道吗?最近在科技圈里,有个大新闻可是闹得沸沸扬扬的,那就是鸿蒙系统竟然有了安卓文件!是不是觉得有...
宝马安卓车机系统切换,驾驭未来... 你有没有发现,现在的汽车越来越智能了?尤其是那些豪华品牌,比如宝马,它们的内饰里那个大屏幕,简直就像...
p30退回安卓系统 你有没有听说最近P30的用户们都在忙活一件大事?没错,就是他们的手机要退回安卓系统啦!这可不是一个简...
oppoa57安卓原生系统,原... 你有没有发现,最近OPPO A57这款手机在安卓原生系统上的表现真是让人眼前一亮呢?今天,就让我带你...
安卓系统输入法联想,安卓系统输... 你有没有发现,手机上的输入法真的是个神奇的小助手呢?尤其是安卓系统的输入法,简直就是智能生活的点睛之...
怎么进入安卓刷机系统,安卓刷机... 亲爱的手机控们,你是否曾对安卓手机的刷机系统充满好奇?想要解锁手机潜能,体验全新的系统魅力?别急,今...
安卓系统程序有病毒 你知道吗?在这个数字化时代,手机已经成了我们生活中不可或缺的好伙伴。但是,你知道吗?即使是安卓系统,...
奥迪中控安卓系统下载,畅享智能... 你有没有发现,现在汽车的中控系统越来越智能了?尤其是奥迪这种豪华品牌,他们的中控系统简直就是科技与艺...