指令集并行与开发Tomasulo算法-编程知识

指令集并行与开发Tomasulo算法

news/2025/3/16 4:04:39/文章来源:https://www.cnblogs.com/wujianming-110117/p/18774491

指令集并行与开发

Tomasulo算法

1. 概念

Tomasulo 方法是一种用于在超标量处理器中执行指令并处理数据相关（数据相关性）的方法。它主要通过对指令进行乱序执行和动态调度来提高指令级并行性。

可以通过寄存器重命名消除 WAR 和 WAW 相关（通过保留站号间接实现重命名）

也可以通过总线结构在写回寄存器之前将值送入需要的指令中，消除RAW相关

乱序的能力和有关队列大小紧密相关

2.各种阻塞

WAR 读后写（先读后写）冲突（Write After Read）是指一个指令在另一个指令读取相同寄存器之后试图写入该寄存器的情况。这种情况可能会导致结果不正确或者不确定，比如有两个指令，指令1将地址a中的数据写入寄存器b，指令2将寄存器b中的内容写回地址a中，此时如果指令2提前执行了，那么就会有不确定的内容被写入地址a，导致寄存器b的内容也会错误，但是如果必须顺序执行就会发生阻塞降低执行效率

WAW 写后写冲突（Write After Write ）指的是两条指令都对一个寄存器进行了写，但是有可能第一条指令的结果被其他指令依赖，但是写入以后还没读的时候就被第二条指令的结果覆盖了，这样可能造成错误结果。如果必须顺序执行，可能会专门等待依赖第一条指令的所有指令执行完才能执行第二条指令，这样效率会下降。

RAW 写后读（先写后读）冲突（Read After Write）是数据相关性的一种类型，指的是在流水线处理器中，当前指令要读取一个在之前指令写入的寄存器的数值的情况。这种数据相关性可能会导致问题，因为如果当前指令在前一条指令写入数据之前就需要读取这个数据，那么可能会读取到错误的数据或者数据尚未更新。为了解决 RAW 相关性，流水线处理器通常采用数据前推（Data Forwarding）或者暂停（Stalling）的方式来处理；暂停就是等一会，阻塞一会，数据前推即在数据计算完成后，将数据直接传递给需要使用它的指令，而不用等到写入寄存器后再读取。这样可以避免等待写入寄存器的延迟。

WAR和WAW很明显可以通过寄存器重命名解决，RAW的解决依赖于总线，因为总线直接将值广播到了保留站，这样就能直接完成数据前推操作，缓解RAW冲突。

3. 算法结构

整个算法的执行区域与所需结构，如图2-12所示，其中保留站内容：

1）Busy：忙位

2）Op：操作码

3）Vj, Vk：源操作数的值

4）Qj, Qk：保存没有准备好的源操作数保留站号（ 0 表示操作数已经准备好）。

基础算法中的经典站位为 Op - Qj Vj , Qk Vk，如果Vj Vk都准备好了，Qj Qk就都为0。同时寄存器增加一个域（结果状态域）空表示寄存器可用，否则保存产生寄存器结果依赖的保留站号（这个域的意思就是，如果是空的，可以直接去寄存器取所需的操作数；否则，就要等某一条保留站内的指令执行完毕后采用其结果，这个结果后边也是要写到对应寄存器的）。

其中结果总线除了要送回结果外，还要送回对应操作的保留站号，毕竟还有其他操作等待此保留站的指令执行完毕，要通过此保留站号来检测是否是自己所等待的内容。