体系结构汇总复习(练习题)

1.MSI cache一致性协议问题

题解引用自:MSI cache一致性协议_假设在一个双cpu多处理器系统中,两个cpu用单总线连接,并且采用监听一致性协议(msi-CSDN博客

答:

事件A状态B状态
初始状态II
CPU A读SI
CPU A写MI
CPU B写IM
CPU A读SS

接下来分析CPU A/B中各自cache的状态变化:

  1. 初始状态时,cache均为无效,即为I;
  2. CPU A读:
    • 当CPU A的cache处于无效状态时,有处理器读PrRd事件发生,就会发生cache miss这样就会装入新数据,但此时其他的cache可能有也可能没有,所以进入S状态,当然需要总线读事件的支持,所以触发总线读事件BusRd。此时CPU A的cache状态为S状态。
    • 此时CPU B的cache依旧处于无效状态。
  3. CPU A写:
    • 当CPU A的cache处于共享状态(S)时,有处理器写PrWr事件发生,调用总线互斥读BusRdX事件(目的是告诉其他cache我要修改这个cache,你们先都无效掉),当更新数据后,需要进入M状态,告知这是最新的数据,主存中的数据也是过时的。此时CPU A的cache状态为M状态。
    • 此时CPU B的cache依旧处于无效状态。
  4. CPU B写:
    • 当CPU B的cache处于无效状态(I)时,有处理器写PrWr事件发生,会导致cache miss,调用总线互斥读BusRdX事件(目的是告诉其他cache我要修改这个cache,你们先都无效掉),把要写入的数据装入cache(这是由于采用写直达且不分配策略),然后再修改,这时就会进入M状态。
    • 此时处于M状态的CPU A cache,通过总线侦听到有总线互斥读BusRdX事件发生,则把自己的cache状态给无效掉了,此时,CPU A的cache状态为I状态。
  5. CPU A读:
    • 当CPU A的cache处于无效状态时,有处理器读PrRd事件发生,就会发生cache miss这样就会装入新数据,但此时其他的cache可能有也可能没有,所以进入S状态,当然需要总线读事件的支持,所以触发总线读事件BusRd。此时CPU A的cache状态为S状态。
    • 此时处于M状态的CPU B cache,通过总线侦听到有读BusRd的事件时,因为现在我在M状态,我的数据是最新的,所以当然由我提供数据,所以产生FLUSH事件,最后进入S状态。

2.一致性问题

答: 

在TSO模型中,Load 操作可以越过之后的Store 操作,但不能越过之前的 Store 操作;如果处理器 B 在处理器A的 Store 操作完成之前完成了这两个 Load 操作;由于处理器A的 Store 操作的延迟,可能导致处理器 B 读取到 value 的旧值,从而导致r3不一致。

3.MSI目录协议

答:

4.GPU体系结构

补充: Flops=[CPU核数]*[单核主频]*[CPU单个周期浮点计算能力]

以intel xeon 6348 cpu为例,28核,主频2.6GHz,支持AVX512指令集,且FMA系数=2

CPU单周期单精度浮点计算能力=2 (FMA数量)*2(同时加法和乘法)*512/32=64

CPU单周期双精度浮点计算能力=2 (FMA数量)*2(同时加法和乘法)*512/64=32

6348的单精度算力=28x2.6x64=4659Gflops=4.6Tflops

6348的双精度算力=28x2.6x32=2329Gflops=2.3Tflops

答:

a.        1.5GHz\times 0.80\times 0.85\times 0.7\times 10cores\times 32\div 4=57.12GFLOPs/s

b.1        1.5GHz\times 0.80\times 0.85\times 0.7\times 10cores\times 32\div 2=114.24GFLOPs/s

speedup=114.24/57.12=2

b.2        1.5GHz\times 0.80\times 0.85\times 0.7\times 15cores\times 32\div 4=85.68GFLOPs/s

speedup=85.68/57.12=1.5

b.3        1.5GHz\times 0.80\times 0.95\times 0.7\times 10cores\times 32\div 4=63.84GFLOPs/s

speedup=63.84/57.12=1.11

5.超长指令字VLIW

答:

方式一:

采用循环展开的 VLIW 指令进行7次循环展开。假设没有分支延迟,代码一共需要执行10个周期,10个周期内进行了23次操作,指令发射速率为每周期2.3次操作; 操作槽共计5*10=50个槽位,操作槽的有效利用率约为23/50=46%。(可进行优化)

方式二:

采用循环展开的 VLIW 指今进行7次循环展开。假设没有分支延迟期,9个周期内进行了23次操作,指令发射速率为每周期2.5次操作;操作槽个数为5*9=45个,操作槽的有效利用率约为23/45=51.1%

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/334437.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大数据Doris(四十九):Doris数据导出介绍

文章目录 Doris数据导出介绍 一、使用示例

博捷芯BJCORE:划片机行业背景、发展历史、现状及趋势

划片机行业背景、发展历史、现状及趋势 随着科技的快速发展,半导体制造已成为电子设备行业的核心驱动力。在这个技术革新的浪潮中,中国半导体产业迅速崛起,不断突破技术壁垒,逐渐成为全球半导体市场的重要参与者。作为半导体制造…

软件测试|Python对JSON的解析和创建详解

简介 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,已经成为当今互联网应用中广泛使用的数据格式之一。Python提供了内置的模块来解析和创建JSON数据,使得在Python中处理JSON变得非常简单。本文将详细介绍Python…

模集 - 240105 - 模集期末速成

TAG - 模集、期末、速成 模集、期末、速成 模集、期末、速成 // – 高数帮 - 期末速成 – //阈值电压晶体管工作区及其判断方法电路公式//体效应沟长调制效应亚阈值效应…// – 阶段考核1 – //集成电路的优势与特点:体积小、速度快、功耗低、电路中以晶体管为主&a…

sql关键字——with 子查询,row_number()排名函数,lag()函数用法举例

题目: 查询所有选修"英语"的学生成绩与前一名的分数差距,按照成绩降序排序。 针对以上需求,有两种做法 1.使用lag函数 lag()函数,取当前行的上一列,用法是lag(列,往上取的行数,填充…

jquery 合并table表格行或列

合并行 $("#tableId").find("tr").each(function(rowIndex) {var cells $(this).find("td");cells.each(function(cellIndex) {var cell $(this);var prevRowCell table.find("tr:eq(" (rowIndex - 1) ")").find(&quo…

05、Kafka ------ 各个功能的作用解释(主题和分区 详解,用命令行和图形界面创建主题和查看主题)

目录 CMAK 各个功能的作用解释(主题)★ 主题★ 分区★ 创建主题:★ 列出和查看主题 CMAK 各个功能的作用解释(主题) ★ 主题 Kafka 主题虽然也叫 topic,但它和 Pub-Sub 消息模型中 topic 主题及 AMQP 的 t…

WPF 基础入门(资源字典)

资源字典 每个Resources属性存储着一个资源字典集合。如果希望在多个项目之间共享资源的话,就可以创建一个资源字典。资源字段是一个简单的XAML文档,该文档就是用于存储资源的,可以通过右键项目->添加资源字典的方式来添加一个资源字典文件…

RT-Thread:ADC 框架应用,通过 STM32CubeMX 配置 STM32 ADC驱动

关键词:ADC,RT-Thread ADC,STM32 ADC应用 说明:本笔记是记录如何开启 RT-Thread 框架的ADC功能,使用系统自带的ADC函数,并通过 STM32CubeMX 配置 STM32 ADC驱动 。 1. 打开board.h 文件,找到ADC 使用配置的流程&…

联络口译重要吗?怎样选择专业的翻译公司?

联络口译在当今全球化的时代扮演着至关重要的角色。随着国际交流与合作的日益频繁,无论是商务、政治还是文化领域,都需要专业的口译员进行准确的沟通。尤其是在跨语言、跨文化的背景下,联络口译对于保障沟通的顺利进行起着不可替代的作用。那…

IDEA在package下右键,没有new选项

正常情况下如下图,我们在文件夹上右键,是会出现New选项的。 但是今天我尝试将" add frameworks support"添加到右键时,竟然把New都删除了。如下图 搜遍全网,结果搜到的都是为什么在package或者文件夹上右键出现的Ne…

分类预测 | Matlab实现RP-LSTM-Attention递归图优化长短期记忆神经网络注意力机制的数据分类预测【24年新算法】

分类预测 | Matlab实现RP-LSTM-Attention递归图优化长短期记忆神经网络注意力机制的数据分类预测【24年新算法】 目录 分类预测 | Matlab实现RP-LSTM-Attention递归图优化长短期记忆神经网络注意力机制的数据分类预测【24年新算法】分类效果基本描述模型描述程序设计参考资料 分…