机器码是什么?机器码有哪三种

程序语言(C,Java等)是人类能够理解的语言,因此我们可以用程序语言编写软件,交给CPU去执行,如果你直接将程序语言交给CPU去执行,CPU压根就不能理解这种语言,CPU只认识它自己的语言-机器语言即机器码,因此我们需要将程序语言翻译成机器码,翻译的方式有两种,一种是编译,另外一种是解释,编译的意思是把整个程序一次性翻译成机器码,解释的意思说,一句一句地翻译,不管怎么样,我们最终交给CPU的是机器码,让CPU去根据机器码去做它该做的事情。

机器码是什么?机器码有哪三种-1

C翻译成机器码

可以把计算机当做一个黑盒子,输入机器码和数据,CPU执行后输出内容到内存,如下图所示

机器码是什么?机器码有哪三种-1

机器码执行图

汇编语言是人类能够理解的机器指令,后续我们举例子时,直接用汇编语言表示机器指令,它们是等价的。

一.什么是机器码?

机器码也叫机器指令,就像我们人类发出的指令一样,比如:“小明,去卫生间里拿一把扫帚去打扫房间,机器码就是这条指令,这条指令里就包含了干什么事情,去哪里干。

1.1 机器码都有些什么内容

机器码是与计算机硬件紧密关联的,不同的CPU,机器码不一样,就好比不同的国家,语言不一样类似,比如我们常用的CPU如Inter Pentium系列,酷睿系列,AMD 锐龙,ARM,MIPS,IBM PowerPC等,他们的机器码就各不相同, 但都有一个共同的规范就如下图所示。

机器码包含的内容

如上图所示机器码共同的规范就是他们都包括操作码,控制位(可选),操作数(可选),操作数可以有多个(一般1-3个)甚至没有。

操作码:表示指令类型,比如ADD表示加法指令,SUB表示减法指令。一个处理器可以包含非常复杂,面面俱到的指令,也可以包含十分精简,短小精干的指令,正因如此,在CPU界分成了两大门派CISC(复杂指令集)和RISC(精简指令集),CISC属于大包大揽,啥都想干,RISC是我只敢我能做的事情,其他的事情交给编译器,下面的表格为这两个门派的成员

CISC RISC
Inter,AMD ARM,MIPS,IBM PowerPC

控制位:几乎用不到,不做详解

操作数:表示指令需要操作的数据,在机器码中,操作数可不一定是放在那里,等着你直接去拿的,有以下几种获取的方式

立即数寻址:立即数是一个整数,例如5,不需要从寄存器或者内存中获取,它本身就是操作数,例如ARM CPU下的指令

ADD  r1,r2,#5

上面代码中5就是立即数,是常量,直接将R2寄存器中的内容与5相加,存储到r1寄存器中。

直接寻址:从内存中直接获取操作数,例如Inter Pentium CPU下的指令

MOV AX,[2468]

上面代码将内存地址2468上指向的内容写入到ax寄存器

间接寻址:不直接从内存地址获取操作数,而是将内存地址存储在寄存器中,通过寄存器间接获取操作数,例如ARM下的指令

LDR  r1, [r2]

上面代码,r2寄存器中存储的是内存地址,上面指令表达的意思是,将r2寄存器中存储的内存地址指向的内容写入到r1寄存器。

偏移量间接寻址:它是间接寻址变种的一种,例如ARM下的指令

LDR r2,[r3,#8]

上面代码,r3寄存器中存储的是内存地址,上面指令表达的意思是,将r3寄存器中存储的内存地址加上偏移8后算出的内存地址指向的内容写入到r2寄存器。

1.2 机器码的格式

正如上文提到不同的CPU类型机器码不同,有的CPU机器码支持动态长度,动态扩展,如Inter系列,它有时候可以一条指令中有多个操作码,有的CPU的机器码长度是固定的,如ARM,我们可以分析大多数的机器码,大多数的机器码占一个字(32位或64位),一般超过一个字的机器码不多,可能只有Inter系列会有,一般用不到,这里不做阐述。

大多数的机器码格式包括以下四种:

三地址机器码格式

三地址机器码格式主要在RISC CPU中用到,例如下边ARM一条汇编指令

ADD r1,r2,r3

上述代码表示将r2寄存器中的值加上r3寄存器中的值,写入达到r1寄存器

双地址机器码格式

双地址机器码格式主要在CISC CPU中用到,例如下边Inter Pentium的一条汇编指令

ADD AX BX

上述代码讲过BX寄存器的内容与AX相加后,写入到AX中,双地址机器码的坏处也很明显了,例如AX寄存器的值执行命令后就被覆盖了,不能够重用了。

单地址机器码格式

单地址机器码格式在RISC,CISC CPU都会用到,例如下边ARM一条汇编指令

LDA r1

上述代码表示将r1寄存器的值加到累加器(一种寄存器,用于存储中间结果),单地址机器码其实也是有两个操作数,一个是r1,另一个就是累加器,因为LDA r1已经意味着追加累加器的意思,所有不需要指定。

零地址机器码格式

零地址机器码格式一般操作栈顶的数据,不需要寄存器参与,零地址机器码格式不会用到地址,对于单操作数运算,例如递增,递减,取负,清零等一元运算,直接用栈顶的数据,对于双操作数从栈顶陆续出栈两个数,然后运算,下边举例子,例如下边的表达式

Z=(A+B).(C-D)

PUSH A                                          ;A入栈
PUSH B                                          ;B入栈
ADD                                              ;栈顶两个数出栈,相加,然后结果入栈
PUSH C                                         ;C入栈
PUSH D                                         ;D入栈
SUB                                               ;栈顶两个数据出栈,相减,然后结果入栈
MUL                                              ;栈顶两个数据出栈,相乘,然后结果入栈
POPZ                                            ;栈顶数据出栈

二.番外篇

2.1 寄存器

寄存器和内存一样都是存储器,从功能上讲跟内存没什么区别,都是用来存储数据,从其他角度来看,寄存器和内存有如下区别

a.寄存器的速度比内存快N的等级,因此为了加快CPU获取指令或者数据的速度,就会将最近要访问的数据放入到寄存器中。

b.寄存器的个数是有限制,一般计算机不到百个,寄存器寻址直接用名称,例如ARM CPU寄存器 r1,r1就是寄存器的名称,可以通过r1直接访问寄存器的内容,而内存则用地址,例如1234表示内存的地址

在CPU中寄存器分为以下几种

内存地址寄存器(程序员不可见)

保存了当前正在读或者正在写的内存地址

内存数据寄存器(程序员不可见)

保存了当前刚从内存读出的数据或者准备要写入内存的数据

PC 程序计数器(程序员不可见)

保存了下一条要执行的指令的内存地址

IR指令寄存器(程序员不可见)

保存了当前正在执行的指令

通用寄存器(程序员可见)

存储临时的数据例如中间结果)

特殊寄存器(程序员不可见)

例如累加器,条件寄存器等

2.2 机器码长度设计

在1.2章节中阐述了机器码的格式,没有指出机器码长度的设计,这里指出。

指令长度算法:

操作码长度+控制位长度+寄存器寻址个数*寄存器占用位数+内存直接取址个数*内存占用位数+立即数长度

操作码长度:

CPU支持的指令个数,如果支持8个指令,那操作码长度就是3

控制位长度:

这个是固定的

寄存器寻址个数*寄存器占用位数:

寄存器占用位数可以通过程序员可以访问的寄存器个数换算得知,如果寄存器可以访问的寄存器个数为32,那么寄存器占用位数就是5(2的5次方=32)

寄存器寻址个数表示机器码中通过寄存器获取操作数或者间接通过寄存器获取操作数的寄存器个数例如

ADD r1,r2 表示通过r1,r2两个寄存器获取操作数,那么寄存器寻址个数就是2

内存直接取址个数*内存占用位数:

内存直接取址个数表示有多少通过内存直接寻址获取操作数,例如

MOV BX,[1234] 表示从1234内存地址获取操作数,内存直接取址个数为1

立即数长度

根据立即数的范围得出,例如立即数范围为0-999,那么立即数长度就是10,2的10次方=1024刚好大于999,可以完全包含立即数的范围。

举例论证:

以三地址机器码格式为例,假设目的地址,源地址都是寄存器,那么一个寄存器占用5位,3个寄存器占用15位,对于32位字长的cpu,操作码+控制位就是17位,如果操作数部分不够15位,则操作数部分自动扩展为32位。

原创文章,作者:发布专员,如若转载,请注明出处:https://ziliaobaba.com/22771.html

(0)
发布专员发布专员
上一篇 2022年11月8日 17:12
下一篇 2022年11月8日 17:16

相关推荐

  • 卡拉赞后门怎么开?卡拉赞后门钥匙

    虽然TBC怀旧服的蛋刀给人一种掉率极高的感觉,游戏中也已经有很多凑齐蛋刀的玩家,但是依然有不少玩家至今只有一把蛋刀,而这种玩家也被亲切地称之为“杨过”。当一名“杨过”成功凑齐双蛋刀的时候都会非常高兴,然而下…

    2022年10月16日
  • 浙江中小学放假时间2021年(浙江中小学放假安排2021年寒假提前)

    来源:浙江新闻据健康浙江24日消息,12月23日0-24时,浙江新增确诊病例1例(绍兴市集中隔离点检测发现),已排查密切接触者均已实施集中隔离。截至23

    2022年1月6日
  • 穿越火线上尉是什么图标?穿越火线军衔图标

    如今cf已经迎来第十几个年头了。最近穿越火线活动也是让人欣喜不断,可以免费领取很多装备,甚至还有永久角色可以领取,但是不管领取多少装备,已经没有了当年玩cf的那种感觉。我想很多玩cf的老兵现在都已经各自成家…

    2022年11月13日
  • 他们是不喜欢看到自己吗?他不喜欢你

    经常思考一个问题,在这个世界上真的有人做到释怀吗?所谓的释怀无非就是对一切所得所失不会再去斤斤计较,而是能够以一种坦荡的胸怀去面对所有。 对于这个问题的答案,很多人会很明确地去说没有,认为只要经历过的…

    2021年11月12日
  • 好用的散粉?好用的瓶装散粉

    散粉用在底妆的最后一步也是很重要的 可以用散粉刷定妆,少量多次蘸取散粉更加轻薄自然呢。 可以用粉扑定妆,妆容会很服帖的。 可以用美妆蛋定妆,定妆很持久呢…

    2021年11月16日
  • 柘榴是什么

    柘榴:一种营养丰富的水果 一、什么是柘榴 柘榴(Punica granatum)是一种营养丰富的水果,它是一种灌木,可以长到5米高,有着深红色的果实,果实的外表有着锯齿状的皮,果实的内部有着红色的种子和白色的果肉。柘榴…

    投稿 2023年8月17日
  • bios设置显卡(bios设置显卡启动顺序)

    华硕主板开启iGPU设置独显核显一起用 目前的Intel和AMD的处理器,都有带核心显示卡的型号。而通常在安装了独立显示卡之后,CPU的核心显示卡(核显)会被自动屏蔽掉不再启动。如何让CPU的核显和独立显示卡一起工作?…

    2022年10月19日
  • 计算机发展的四个阶段?计算机发展史

    在现在,计算机已经成为我们工作生活娱乐必不可少的一个工具了,而对于计算机的发展史,我们又有多少了解呢? 今天我们就来了解一下,计算机自问世以来所经历过的几个阶段吧。 世界上第一台电子数字计算机(ENIAC)…

    2021年11月14日
  • 商战电视剧(商战电视剧推荐)

    1、《天道》;这几天被朋友推荐又看了一遍,前半部的台词还是似懂非懂,不过整体意思看明白了。王志文很棒,有个演员曾经评价他,说:看他演的电视剧不用看,只听就够了。他的声音很有特点,不急不缓,直击心灵。 是…

    2022年10月5日
  • 晚上不能去做的事情?如何去做一件事情

    大家常说:“世间唯有美食与爱不可辜负。” 生活中确实也是如此。爱可以战胜一切,包括冬天的严寒。而美食为我们提供能量,让我们干自己想干的事情。 今天小编想与大家分享一些保持健康的方法,愿君受益! 首先是吃饭…

    2021年11月15日