05 Machine-Level Representation of Programs
创始人
2025-05-29 13:20:00
0

既然 complier 能帮助我们将 code 转换为 low-level language 我们为什么还要学习呢?

  • By invoking the compliler with appropriate command-line parameters(通过使用适当的命令行参数调用编译器)
    编译器将生成一个以汇编代码形式显示其输出的文件
  • 通过阅读代码,我们可以了解编译器的优化功能,并分析代码中潜在的低效率

程序员学习机器代码的需求已经转变为阅读和理解编译器生成的代码。

读汇编的过程实际上是一个 a form of reverse engineering(逆向工程的一种形式)----->试着通过研究系统和向后工作来理解系统创建的过程

  • 项目的展示基于 X86-64:一台32位的机器只能使用大约4gb(2^32)位的随机存取存储器

3.2 Program Encodings

当我们写完 c program 我们可以compile通过
linux> gcc -Og -o p p1.c p2.c

  • -Og表示编译器应用一定级别的优化,生成遵循原始C代码整体结构的机器代码
  • 当然优化程度越高, C代码和汇编的差距越大,因此采用不那么大的 -Og 来进行学习

3.2.1 Machine-Level Code

计算机系统有两种重要的抽象

第一种 指令集: 机器级程序的格式和行为由指令集体系结构(ISA)定义
(1)描述处理器状态
(2)指令的格式
(3)每条指令执行之后的status

第二种 Virtual Memory(虚拟内存)
一些在C代码中隐藏的细节,可以在汇编代码中看到
(1)program counter(计数器)在x86-64中被叫做 %rip
(2)integer registee file(整数注册文件):可以存储 地址/指针;integer data;存储某些程序重要状态
(3)Condition Code Registers(条件代码寄存器):实现对于不同指令状态的记录, 比如跳转啥的
(4)A set of vector registers 存储 interger / floating point: 一组整数/浮点数向量寄存器

3.2.2 Code Examples

linux> gcc -OG -S mstore.c
-S:表明告诉编译器 to generate assembly file and go no further(以生成程序集文件,并没有进一步)
long mult2(long, long);void multstore(long x, long y, long* dest){long t = mult2(x, y);*dest = t;
}

assembly:

mulstore:pushq %rbx			//将rbx中内容 push 到 program stackmovq %rdx, %rbxcall mult2moveq %rax, (%rbx)popq %rbxret

如果我们选择了

linux> gcc -Og -c mstore.c

这样会generate an object-codee file mstore.c:

类似
53 48 86 d3 e8 00 00 00 00 48 5b c3

想知道binary code 代表什么意思,可以使用disassemblers
linux 系统中有 OBJDUMP 可以 实现
linux> objdump -d mstore.c
在这里插入图片描述

对于机器表示的内容

  • X86-64 指令集 每条指令 1-15个 bytes
    一般来说 操作数越多,指令bytes越多
  • 每个指令都是 prefix-free, 类似霍夫曼coding
    从给定的起始位置开始,有一个唯一的字节解码成机器指令
    比如 只有 pushq %rbx can start with byte value 53
    在这里插入图片描述

Notes on Formatting

一般我们采用
linux> gcc -Og -S mstore.c
在这里插入图片描述

Data Formats

由于历史设计的原因

Intel uses “word” to descript 16-bit data type

  • 32-bit 被叫做 double word
  • 64 bit quad words
  • X86家族中 Microprocessors (微处理器)实现了 all floating-point operations with a special 80-bit floating-point format(所有具有特殊80位浮点格式的浮点操作)
  • 大多数的 assembly-code (汇编代码)通过后缀表明到底操作的是 什么 word
    (1)movb (move byte)
    (2)movw(move word)
    (3)movl(move double word)
    (4)movq(move quad word)

Accessing Information(访问信息)

X86-64 CPU 包含了 16个 64位 寄存器

  • used to store integer data as well as pointer(用于存储整数数据和指针+
  • Byte-level operations can access the least significant byte(字节级操作可以访问最不重要的字节)
  • 16-bit operations can access the least significant 2 bytes(16位操作可以访问最不重要的2个字节)
  • 32-bit operations can access the least significant 4 bytes(32位操作可以访问最不重要的4个字节)
  • 64-bit operations can access the whole register(64位操作可以访问整个寄存器)
    在这里插入图片描述

3.4.1Operand Specifiers操作数说明符

在这里插入图片描述
指令中几种不同的操作数:

  • immediate -> constant values $577
  • register --> $5
  • memory reference(内存引用):
    (1)因为我们认为内存是一个巨大的数组
    (2)我们采用数组形式access:Mb[Addr] 表示 a reference to the b-byte value store in memory starting at address

为啥要有这么复杂的 内存reference格式?
它们在引用数组和结构元素时非常有用

3.4.2 Data Movement Instructions(数据移动说明)

Move class, 最简单的形式, 就是从一个地方拷贝到另外一个地方
在这里插入图片描述
在这里插入图片描述

注意这个图片, 如果 move bytes 那么只动后面两个
在这里插入图片描述

MOVZ class 会将dest 的剩余数字全部填充为 0
MOVS class 会将剩下的数字填充 based on sign extension
在这里插入图片描述

Data Movement Example

C code

long exchange(long* xp, long y){long x = *xp;*xp = y;return x;
}

Assembly Code

在这里插入图片描述
对上述code进行两点剖析

  • 在 C中的pointer 实际上 deferencing a pointer involves
    (1)Copying that pointer into a register(将该指针复制到寄 存器中)
    (2)use this register in a memory reference(在内存引用中使用此寄存器)

  • local variables such as X are often kept in registers rathre than stored in memory locations(局部变量(如X)通常保存在寄存器中,而不是存储在内存中)
    (1)因为 Register Access 通常比 Memory Locations 快很多

Pushing and Poping Data

The stack plays a vital role in the handling of procedure calls(堆栈在过程调用的处理中起着至关重要的作用)
在这里插入图片描述
在这里插入图片描述

注意:

  • push操作涉及堆栈指针的递减
    (1)实际上分两步, 第一步:堆栈指针减8
    (2)然后在策略地址的新顶部写入值
  • pop包括从内存中读取和堆栈指针的增量

pushq % rbp 和 下面两步相同
在这里插入图片描述
popq %rax 和下面两步相同
在这里插入图片描述

3.5 Arithmetic and Logical Operations(算术和逻辑运算)

蛮多汇编指令有 variant (变体)在 word size 比如:

  • addb
  • addw
  • addl
  • addq
    在这里插入图片描述

3.5.1 Load 指令

当然load指令也有一些用处 当实施简单的加减法

long scale(long x, long y, long z){long t = x + 4 * y + 12 * z;return t;
}

在这里插入图片描述

3.5.2 Unary and Binary Operations(一元运算和二元运算)

第二组指令是 只有一个操作数 的指令

  • 这个操作数可以是一个寄存器,也可以是一个内存位置

incq(%rsp) //这条指令让 stack 顶的元素 + 1

类似与x ++,y –

第三组指令是

subq %rax, %rdx
实际上的作用是 %rdx - %rax
英文语义是 subtract %rax from %rdx

同时对于 MOV 指令来说, 两个 oprand 不能同时是 memory location

  • 如果 destination 是 memory 那么处理器必须从内存中读取值,执行操作,然后将结果写回内存

3.5.3 Shift Operations(移位操作)

在这里插入图片描述

相关内容

热门资讯

安卓系统换成苹果键盘,键盘切换... 你知道吗?最近我在想,要是把安卓系统的手机换成苹果的键盘,那会是怎样的体验呢?想象那是不是就像是在安...
小米操作系统跟安卓系统,深度解... 亲爱的读者们,你是否曾在手机上看到过“小米操作系统”和“安卓系统”这两个词,然后好奇它们之间有什么区...
miui算是安卓系统吗,深度定... 亲爱的读者,你是否曾在手机上看到过“MIUI”这个词,然后好奇地问自己:“这玩意儿是安卓系统吗?”今...
安卓系统开机启动应用,打造个性... 你有没有发现,每次打开安卓手机,那些应用就像小精灵一样,迫不及待地跳出来和你打招呼?没错,这就是安卓...
小米搭载安卓11系统,畅享智能... 你知道吗?最近小米的新机子可是火得一塌糊涂,而且听说它搭载了安卓11系统,这可真是让人眼前一亮呢!想...
安卓2.35系统软件,功能升级... 你知道吗?最近在安卓系统界,有个小家伙引起了不小的关注,它就是安卓2.35系统软件。这可不是什么新玩...
安卓系统设置来电拦截,轻松实现... 手机里总是突然响起那些不期而至的来电,有时候真是让人头疼不已。是不是你也想摆脱这种烦恼,让自己的手机...
专刷安卓手机系统,安卓手机系统... 你有没有想过,你的安卓手机系统是不是已经有点儿“老态龙钟”了呢?别急,别急,今天就来给你揭秘如何让你...
安卓系统照片储存位置,照片存储... 手机里的照片可是我们珍贵的回忆啊!但是,你知道吗?这些照片在安卓系统里藏得可深了呢!今天,就让我带你...
华为鸿蒙系统不如安卓,挑战安卓... 你有没有发现,最近手机圈里又掀起了一股热议?没错,就是华为鸿蒙系统和安卓系统的较量。很多人都在问,华...
安卓系统陌生电话群发,揭秘安卓... 你有没有遇到过这种情况?手机里突然冒出好多陌生的电话号码,而且还是一个接一个地打过来,简直让人摸不着...
ios 系统 安卓系统对比度,... 你有没有发现,手机的世界里,iOS系统和安卓系统就像是一对双胞胎,长得差不多,但细节上却各有各的特色...
安卓只恢复系统应用,重拾系统流... 你有没有遇到过这种情况?手机突然卡顿,或者某个应用突然罢工,你一气之下,直接开启了“恢复出厂设置”大...
安卓系统出现支付漏洞,揭秘潜在... 你知道吗?最近安卓系统可是闹出了不小的风波呢!没错,就是那个我们每天离不开的安卓系统,竟然出现了支付...
苹果换了安卓系统恢复,体验变革... 你有没有遇到过这种情况?手机里的苹果突然变成了安卓系统,而且还是那种让你摸不着头脑的恢复模式。别急,...
安卓怎么卸载系统app,轻松告... 手机里的系统应用越来越多,有时候真的让人眼花缭乱。有些应用虽然看起来很实用,但用起来却发现并不适合自...
安卓系统查看步数,揭秘日常运动... 你有没有发现,每天手机里的小秘密越来越多?今天,咱们就来聊聊安卓系统里那个悄悄记录你每一步的小家伙—...
安卓系统未来会不会,未知。 你有没有想过,那个陪伴我们手机生活的安卓系统,它的未来会怎样呢?想象每天早上醒来,手机屏幕上跳出的信...
安卓系统怎么设置截图,轻松捕捉... 亲爱的手机控们,你是不是也和我一样,有时候想记录下手机屏幕上的精彩瞬间呢?别急,今天就来手把手教你如...
安卓系统下载软件安装,安卓系统... 你有没有发现,手机里的安卓系统就像一个巨大的宝藏库,里面藏着各种各样的软件,让人眼花缭乱。今天,就让...