前言
计算机组成原理及体系结构
数据的表示
进制的转换
原码反码补码移码
最高位是符号位,负数符号位为1
反码补码正数和原码一样,负数有区别
反码符号位不动,其他位置取反
补码在反码基础上加1
移码是将补码的符号为取反
在原码和反码中,正0和负0的表示是不一样的
而在补码中,正0和负0的表示都是00000000
-128的补码是10000000
浮点数运算
CPU
计算机体系结构分类FLynn
阵列处理机为SIMD代表,适用于对数组的运算
MISD为理论模型
CISC和RISC
CISC是原来定制的电脑
流水线
这里流水线周期是2ns
在第一个指令完成之后, 每个流水线周期都会完成一个指令,所以可以得到理论公式
但是如这个例子中,执行是1ns完成的,而分析是2ns,所以在第一条指令完成的时候,第二条指令并没有到执行阶段,还需要等1ns,也就是三个阶段都是2ns,所以有了实践公式
考试中多数情况是按理论公式来算,少数情况是实践公式(我记得这里应该不是随意选择的,应该是按具体例子来看用什么公式)
每个步骤时长一样流水线的效率最高
层次化存储结构
按内容存储是存储的时候考虑内容,速度效率高于按地址存储的存储器
相联存储器是一种按内容访问的存储器。其工作原理就是把数据或数据的某一部分作为关键字,按顺序写入信息,读出时并行地将该关键字与存储器中的每一单元进行比较,找岀存储器中所有与关键字相同的数据字,特别适合于信息的检索和更新。
相联存储器可用在高速缓冲存储器中,在虚拟存储器中用来作为段表、页表或快表存储器,用在数据库和知识库中。
Cache
空间局部性,访问临近的空间
主存
随机存储器掉电信息消失
磁盘工作原理
注意这里指针是一直转动的,由于是单缓存区,所以处理第一个记录的时候指针还一直转动,需要再转一圈才能处理第二个记录,也就是说处理第一个记录加转动到第二个记录前,需要3+33共36ms,处理10个记录就是360,在加上处理第11个,读取加处理共6,最后结果就是366
后面一个是B
计算机总线
内部总线是微机内部芯片和处理器之间的,芯片级别的
系统总线是微机中各个插件板和系统板之间的,是插件板级别的,例如PCI、VGA接口
外部总线是微机和外部设备的总线
串联系统和并联系统可靠度计算
校验码
CRC校验码
可以检错,但是不能纠错
模2除法中不是相减,而是做异或
将原始报文补充(多项式位数-1)位0,做模2的除法
得到的余数补充到原始报文后面,形成CRC
检测的时候做模2除法,得到余数为0则表示正确;反之错误
海明校验码
可以检错,也可以纠错
这个例子中,1011有四个信息位置,因此需要4个信息位
那么需要几个校验位呢,就是用(1)中所用的公式,需要3位校验位
校验位的值需要用异或得到
接收到信息之后,会按原来产生校验位的方式再产生校验位
两个校验位异或,得到出错的位置是在哪里
操作系统原理
进程的状态
前趋图
表达事件的前后关系
进程的同步和互斥
互斥的反义词是共享
同步的反义词是异步
同步指停下来等待
PV操作
P申请资源,V释放资源
S相当于资源个数,如果申请了一个资源以后,资源个数成-1了,那么只能让这个进程去等待;
如果S+1以后,相当于释放了一个资源,如果有大于0了,那么就运行进程,反之继续等待
AC
假设收银员要收款,但是没有人,需要等待,所以是b1是P(S1)
对应的,购书者来了,释放资源,V(S1)
付款以后,需要等待收银员操作,扫描、消磁等,所以a2是P(S2)
收银员释放资源,操作完以后,可以让购书者走,所以是V(S2)
将a1、b1调换,a2、b2同时调换也可以,但是不好解释
而如果a1、b1同时为P,那么这个进程就同时在等待资源,卡住了
同时为V可以吗,好像说不通,因为不管是从购书者还是收银员的角度,不可能刚开始都释放资源
PV操作与前趋图
CAA
死锁问题
银行家算法
存储管理——分区存储组织
页式存储 段式存储 段页式存储
页面大小为4K,即页内地址有12位,则页号为5,对应物理块号为6
物理块号又叫做页帧号
访问位为0的才能淘汰
DA
相联存储器,由内容查找
页面淘汰算法
最优算法是理论上的,实际应用中没法应用
一般考FIFO,LRU
抖动是分配了更多的资源,但是效率更低了
如图,用FIFO算法,给了4个内存,但是缺页次数更多了
没有使用快表,表示每次访问需要先查询一下页表,然后再查找相应的内存块;
所以每个块需要访问两次内存
6个块所以需要12次对内存的访问
指令无论占用几个页,都只产生一次缺页中断
数据占用几个页,就产生几次缺页中断
所以是1+2+2=5
索引文件结构
索引结点一般有13个结点,编号0到12;考试不是13个结点,会有说明
CD
树型目录结构
空闲存储空间管理–位示图法
第多少个字是从1开始算,而分配位置是从0开始算
数据传输控制方式
程序控制方式又叫程序查询方式,最为低级的,CPU介入很多,外设很被动,CPU发出指令查询外设有没有传输结束
程序中断方式主动性强一点,外设完成了数据传输发出中断,系统做下一步处理
DMA,直接存取控制方式,有专门的DMA控制器,外设与内存的数据交换用这个控制器监管
虚设备和Spooling技术
核心在于开设了缓冲区,按队列顺序处理,解决速度之间的矛盾差异
微内核操作系统
数据库系统
数据库三级模式两级映射
内模式管理按什么格式存储数据
概念模式是表这个级别,把数据分成若干张表
外模式,对应数据库的视图,灵活的数据控制手段
数据库设计过程说明
ER模型
局部ER图的集成
1:1最少可以转换成两个关系模式,联系可以放在任意一个实体
1:n最少可以转换成两个关系模式,联系可以放在n的那个实体(部门:员工)
m:n最少可以转换为3个关系模式
多个实体间的关系可以转为1个关系模式
关系代数
投影选的是列,选择选的是的行
也可以用这种方式写
连接操作不写条件的时候,称为自然连接,默认按相同的字段做等值
规范化理论
函数依赖
价值与用途
求候选关键字
超键可能存在冗余属性
1A
2ABCD
3B,不能写成AB这种形式,AB表示AB的组合键
范式
范式越高,表拆分越细
主属性是候选键的一部分
这里CREDIT学分这个列可以直接由课程号CNO确定,因此存在部分函数依赖,需要拆分
存在数据冗余,更新异常,插入异常(比如想插入一个新的课,插入不进去,因为没有学号)
删除异常,如果删除了一个学号,可能学分也都被删除了
也要求达到了第二范式
这个图中,没有非主属性,所以肯定是第三范式
但是由于T->J的函数依赖中,T不是候选键,所以不是BC范式
例题
第一个表中只有一个主键,所以没有部分函数依赖,所以CDA
模式分解
并发控制
持久性
S锁是读锁,X锁是写锁
完整性约束
实体完整性约束,主键不能为空不能重复
参照完整性约束,外键的约束
用户自定义完整性,用户可以设置一个变量的要求
是提高数据可靠性的手段
触发器是写脚本来约束数据库,复杂的要求要用触发器完成
数据库安全
审计是用日志记录用户操作
数据备份与恢复
数据仓库与数据挖掘
数据集市是部门级的数据仓库
OLAP是联机处理分析服务器
反规范化技术
空间换时间
大数据技术基本概念
计算机网络
七层模型
中继器是为了延长传输距离,集线器是多端的中继器
局域网工作在下面两层,典型设备是交换机,局域网内部有广播
P和S之间是由路由器连接的,是三层设备,不在一个局域网,因此不能通过
网路技术标准与协议
TCP/IP是一种重量级的协议,效率比较低,传输比较慢
IPX/SPX:局域网的即时战略游戏使用
ICMP:因特网控制协议
ARP:IP地址转MAC地址
DHCP动态IP地址分配
TFTP小文件传输协议
SNMP简单网络管理协议
DNS域名解析
中间三个是文件的共享协议,用两种传输层协议都能实现,SAMBA可以跨平台
169.254.0.0 是window里面的,后面是linux中的
是假地址,不能跟外界通信;可能是DHCP服务器故障,或电脑故障
网络类型与拓扑结构
星型中心结点一般是交换机
网络规划与设计
开放性是遵循通用的协议
先进性指不能用太过失的东西,但也不能用太新的
接入层和核心层只有一个层次
接入层把设备接入进来,最多做一下计费
核心层做高速数据的转发,可靠性要求比较高,所以经常有冗余设计
设计的时候从下往上设计
IP地址与子网划分
前面是网络地址,后面是主机地址
主机号全0代表的是网络的地址,全1的地址是广播地址
A类地址第一位为0
一个A类地址有2^24-2个主机
划分子网的时候不考虑两个特殊的地址,可以分配,也就是2^n>27
主机计算的时候需要考虑两个特殊的地址
C,4个剩余的位置可以划分子网
特殊含义的IP地址
回播地址,本机地址127.0.0.1
中间三个数值的地址是内部地址,不是公网上使用的地址;因为国内绝大部分局域网内没有分配公网IP,都是这些仅由于局域网的IP,对外出口才设置一个公网IP;这是因为国内IP地址严重不足
HTML
无线网
无线个人网还有一个ZIGBEE
网络接入技术
PSTN:传真/POS机
同轴光纤,有线电视
主要用的3G标准是WCDMA,后面两个都用的比较少,国内曾经移动推过TDSCDMA,但是推不动,不成熟
后面发展到4G,第一个LTE可以分为TDD和FDD,TDD是由TDSCDMA发展来的,现在在国内运用很广泛,FDD是由WCDMA发展来的
最后无线的标准其实在3G也有
IPV6
系统安全分析与设计
信息系统安全属性
对称加密与非对称加密
DES有密码本,对应翻译
对称加密速度快下,效率高
非对称加密速度慢,不适合加密大数据量的数据
信息摘要
信息摘要是信息的特征值
如果信息发生变化,摘要会改变
信息摘要是为了信息安全
单向hash函数,是指信息可以形成摘要,而摘要不能返回形成信息
所以信息摘要算法不能应用于加密
现在存在的信息摘要破解其实是有一个数据库,从里面推测信息,而不是真正的还原信息
数字签名
数字签名没有保密功能,只有识别功能
一般是对摘要进行签名,因为简短,适合非对称加密
数字信封与PGP
数字信封了解原理即可
非对称加密其实存在身份不确定的问题
数字证书将个人密钥和信息绑定、类似身份证
现在用的安全机密的体质往往都和数字证书结合起来
有专门的颁发机构CA
数字证书上有颁发机构的签名,可以验证数字证书是不是伪造的
设计邮件机密系统(例题)
大的附件加密用的是对称机密技术
邮件正文用对称加密,但是需要将密钥K用接受方的公钥加密(数字信封);接收方用私钥解开,得到正文
发送者不可抵赖,需要用数字签名;无法篡改用到完整性技术,信息摘要技术
正文形成摘要,并用接收方的私钥加密;其实就是签名后的摘要
接收方解密得到摘要,将得到的正文形成摘要,经过对比,如果相同说明没有篡改
各个网络层次的安全保障
从第二层开始就是用协议保障安全,所谓协议就是通信时候分包的规则
PPTP、L2TP是隧道协议,在隧道中传输比较安全
防火墙有硬件的也有软件的;
IPSec针对IP包进行加密的协议(一般IP包不用加密),一种是将IP包中的数据加密;一种是将IP包整体加密,附加一个头传输
TLS标准传输层安全协议;SET电子商务的协议
SSL跨越了多个层次
网络威胁与攻击
重放攻击又叫做ARP欺骗攻击
窃听合法手段比如获得了更大的管理权限而获得信息
业务流重点是长期的监听,有分析的成分
防火墙技术
网络级的工作层次低,但是效率高;例如疫情时候的卫生检疫站,只检查来源自哪里,不检查内部的东西
应用级的工作层次高,但是效率低;开箱检查,需要把内部的东西拆出来检查
状态检测例如TCP连接检测
屏蔽子网涵盖了前面两种形式
屏蔽子网很复杂,基本思路是弥补防火墙的缺陷(不能防范内部攻击,防外不防内)
在外网和内网之间做了屏蔽子网区,也叫做隔离区,或者叫做DMZ,非军事区;这个区域既不属于内部也不属于外部;一般放对外提供服务的服务器,例如web、邮件服务器
这样做,有两道防火墙,提高了安全性;内部访问服务器,也需要经过防火墙
但是,纯粹的内部攻击也无法杜绝