体系结构汇总复习（练习题）-编程知识

体系结构汇总复习（练习题）

1.MSI cache一致性协议问题

题解引用自：MSI cache一致性协议_假设在一个双cpu多处理器系统中,两个cpu用单总线连接,并且采用监听一致性协议(msi-CSDN博客

答：

事件	A状态	B状态
初始状态	I	I
CPU A读	S	I
CPU A写	M	I
CPU B写	I	M
CPU A读	S	S

接下来分析CPU A/B中各自cache的状态变化：

初始状态时，cache均为无效，即为I；
CPU A读：
- 当CPU A的cache处于无效状态时，有处理器读PrRd事件发生，就会发生cache miss这样就会装入新数据，但此时其他的cache可能有也可能没有，所以进入S状态，当然需要总线读事件的支持，所以触发总线读事件BusRd。此时CPU A的cache状态为S状态。
- 此时CPU B的cache依旧处于无效状态。
CPU A写：
- 当CPU A的cache处于共享状态（S）时，有处理器写PrWr事件发生，调用总线互斥读BusRdX事件（目的是告诉其他cache我要修改这个cache,你们先都无效掉），当更新数据后，需要进入M状态，告知这是最新的数据，主存中的数据也是过时的。此时CPU A的cache状态为M状态。
- 此时CPU B的cache依旧处于无效状态。
CPU B写：
- 当CPU B的cache处于无效状态（I）时，有处理器写PrWr事件发生，会导致cache miss，调用总线互斥读BusRdX事件（目的是告诉其他cache我要修改这个cache,你们先都无效掉），把要写入的数据装入cache(这是由于采用写直达且不分配策略)，然后再修改，这时就会进入M状态。
- 此时处于M状态的CPU A cache，通过总线侦听到有总线互斥读BusRdX事件发生，则把自己的cache状态给无效掉了，此时，CPU A的cache状态为I状态。
CPU A读：
- 当CPU A的cache处于无效状态时，有处理器读PrRd事件发生，就会发生cache miss这样就会装入新数据，但此时其他的cache可能有也可能没有，所以进入S状态，当然需要总线读事件的支持，所以触发总线读事件BusRd。此时CPU A的cache状态为S状态。
- 此时处于M状态的CPU B cache，通过总线侦听到有读BusRd的事件时，因为现在我在M状态，我的数据是最新的，所以当然由我提供数据，所以产生FLUSH事件，最后进入S状态。

2.一致性问题

答：

在TSO模型中，Load 操作可以越过之后的Store 操作，但不能越过之前的 Store 操作；如果处理器 B 在处理器A的 Store 操作完成之前完成了这两个 Load 操作；由于处理器A的 Store 操作的延迟，可能导致处理器 B 读取到 value 的旧值，从而导致r3不一致。

3.MSI目录协议

答：

4.GPU体系结构

补充： Flops=[CPU核数]*[单核主频]*[CPU单个周期浮点计算能力]

以intel xeon 6348 cpu为例，28核，主频2.6GHz，支持AVX512指令集，且FMA系数=2

CPU单周期单精度浮点计算能力=2 (FMA数量)*2(同时加法和乘法)*512/32=64

CPU单周期双精度浮点计算能力=2 (FMA数量)*2(同时加法和乘法)*512/64=32

6348的单精度算力=28x2.6x64=4659Gflops=4.6Tflops

6348的双精度算力=28x2.6x32=2329Gflops=2.3Tflops

答：

a. $1.5GHz\times 0.80\times 0.85\times 0.7\times 10cores\times 32\div 4=57.12GFLOPs/s$