一、云计算概述
ICT是世界电信协会在2001年的全球性会议上提出的综合性概念,ICT分为IT和CT,IT(information technology)
信息技术,负责对数据生命周期的管理;CT(communication technology)
,负责数据的传输管理。
CT技术是ICT技术栈的底核。
1、计算机
计算机是现代一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具备存储记忆功能。是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。
使用电子设备的任何活动都是计算,能够进行高速计算的设备叫做计算机。
计算机发展史如下:
2、虚拟化
虚拟化(Virtualization)的含义很广泛,将任何一种形式的资源抽象成另一种形式的技术都是虚拟化,是资源的一种逻辑表示。
虚拟化发展史如下:
3、云计算
美国国家标准与技术研究院(NIST) 定义:云计算是一种模型,可以实现 随时随地、便捷地、随需求应变地
从可配置计算 资源共享池
中获取所需的资源(如:网络、服务器、存储、应用及服务),资源能够 快速供应并释放
,使管理资源的工作量和与服务提供商的交互减少到最低限度。
维基百科定义:云计算是一种通过 Internet
,以 服务
的方式提供 动态可伸缩
的虚拟化的资源的计算模式。
云计算发展史:
4、云计算的价值
1、按需自助服务:用户可以根据自身的需求去选择对应的服务规格信息
2、广泛的网络接入:用户可以随时随地通过网络接入到所购买的设备中
3、资源池化:将底层硬件资源解耦,形成一个资源池,提供给上层使用
4、快速弹性伸缩:用户可以快速调整所购买的设备规格,设置自动的扩容
5、可计量服务:云服务商根据用户的使用量进行收费
5、云计算的服务模式
IaaS:infrastructure as a service基础设施即服务,云平台会提供底层的基础硬件设备,用户只需要关注系统以及应用层面部分即可(ECS)
PaaS:platform as a service,平台即服务,云平台提供基础硬件设施以及运行环境,用户只需要关注应用和数据本身即可(容器)
SaaS:software as a service,软件即服务,云平台提供全部环境,用户只需要关注应用本身即可(weboffice)
6、云计算的部署模式
公有云(Public cloud):云服务运营商拥有云基础设施,并为公众或企业用户提供云服务。云计算基础设施由一个组织拥有并向公众或大型的工业团体销售云计算服务。
私有云(Private cloud):云计算的基础设施由单一的组织拥有,并仅仅为该组织运营。
混合云(Hybrid cloud):云计算基础设施由两种或多种云组成,对外仍然表现为一个整体。
二、主流云计算厂商
1、AWS
Amazon Web Services(AWS):亚马逊公司的云计算平台服务。AWS面向用户提供包括弹性计算、存储、数据库、应用程序在内的一整套云计算服务,能够帮助企业降低IT投入成本和维护成本。
AWS合作伙伴通过各种 Program(VMware on AWS、渠道经销商计划、托管服务计划、SaaS合作伙伴计划、能力计划、试用方案、政府合作伙伴计划、Marketplace、Direct Connect计划)在AWS业务领域获得支持。
2、VMware
VMware是面向所有应用提供多云服务的领先提供商,可通过企业控制实现数字化创新。
VMware云计算技术利用VMware混合云和原生公有云,为IT组织提供在任意云中运行、管理、连接和保护的应用。
自1998年成立以来,VMware致力于通过边缘计算、人工智能、区块链、机器学习、kubernetes等颠覆性技术来提供客户构建未来所需的灵活性和选择多样性。
3、华为云
华为云官网:https://www.huaweicloud.com
华为云Stack(华为的私有云)是华为云为政企客户提供的,部署在客户本地数据中心的云基础设施。
从硬件创新开始,从芯打造华为云数据中心
三、服务器介绍
服务器是计算机的一种。它比普通计算机运行速度更快、负载更高且价格更高。
服务器是为用户提供服务的计算机,通常分为文件服务器、数据库服务器和应用程序服务器。
3D工具:https://www.huawei.com/cn/
1、服务器发展历程
- 大型主机阶段
- 20世纪40-50年代,是第一代电子管计算机。经历了电子管数字计算机、晶体管数字计算机、集成电路数字计算机和大规模集成电路数字计算机的发展历程,计算机技术逐渐走向成熟;
- 小型计算机阶段
- 20世纪60-70年代,是对大型主机进行的第一次“缩小化”,可以满足中小企业事业单位的信息处理要求,成本较低,价格可被接受;
- 微型计算机阶段
- 20世纪70-80年代,是对大型主机进行的第二次“缩小化”,1976年美国苹果公司成立,1977年就推出了AppleII计算机,大获成功。1981年IBM推出IBM-PC,此后它经历了若干代的演进,占领了个人计算机市场,使得个人计算机得到了很大的普及;
- x86服务器时代
- 1978年,英特尔推出第一代x86架构处理器—8086中央处理器。
- 1993年,英特尔正式推出Pentium(奔腾)系列,该系列的推出,将x86架构处理器带上了一个新的性能高度。
- 1995年,英特尔推出Pentium Pro—为服务器而生的x86处理器,从此开启了x86的至强时代,其标准化开放性也促成了市场发展,为云计算时代打下了坚实物质基础。
- 云计算时代
- 从2008年起,云计算(Cloud Computing)概念逐渐流行起来,它正在成为一个通俗和大众化(Popular)的词语。
- 云计算被视为“革命性的计算模型”,因为它使得超级计算能力通过互联网自由流通成为了可能。
- 企业与个人用户无需再投入昂贵的硬件购置成本,只需要通过互联网来购买租赁计算力,用户只用为自己需要的功能付费。
- 云计算让用户脱离技术与部署上的复杂性而获得应用。
- 云计算囊括了开发、架构、负载平衡和商业模式等,是软件业的未来模式。
2、服务器类型
服务器的类型:(1U=4.445cm,2路:2个CPU)
- 高密型:1U,2路机架服务器
- 均衡型:2U,1路
- 存储型:4U,2路
- 高性能型:2U,4路
3、计算产业进化
从最早期的大型机、小型机时代,是专用计算,称之为计算1.0;到了x86时代,在Intel的带领下,在摩尔定律的驱动下,计算由专用走向了通用,大量数据中心开始出现,也是当前计算产业所处的阶段,称之为计算2.0;随着数字化程度的加速发展,世界逐步走向智能化,计算已经不仅仅局限于数据中心,也开始走向全栈全场景,称之为计算3.0时代,而这个时代的主要特征就是“智能”,所以也称之为“智能计算”。
- 专用计算(计算1.0,大型机、小型机时代):专门用于特定的应用或工作负载量身定做,比如网络安全,深度学习,功能工业控制等领域。
- 通用计算(计算2.0,数据中心、X86架构):通常不针对任何特定应用,能够执行各种类型的任务,如办公软件,网页浏览,游戏等。它适用于多变的使用环境和需求。
- 智能计算(计算3.0,全栈全场景):ChatGPT是计算3.0的一部分,ChatGPT作为语言大模型的人工智能应用。
4、服务器硬件形态分类
- 塔式服务器:有的塔式服务器采用大小与普通立式计算机大致相当的机箱,有的采用大容量的机箱,像个硕大的柜子。通过转换支架可转化成机架式的服务器。
- 机架服务器:机架式服务器的外形看来不像计算机,而像交换机,有1U(1U=1.75英寸)、2U、4U等规格。机架式服务器安装在标准的19英寸机柜里面。这种结构的多为功能型服务器。 特点是机箱尺寸比较小巧,在机柜中可以同时放置多台服务器,从而获得更高的处理能力。
- 刀片服务器:特点是每个服务器都是一个插板,在插板上配备有处理器、内存、硬盘以及相关组件。由于刀片服务器的特殊架构,所以刀片服务器的使用还需要与刀片服务器的专用机箱结合,通常在一个机箱中可以容纳几个到几十个刀片服务器,所以对于高性能计算、多种应用的前台服务器,应用服务器,以及后台的中心数据库应用都可以满足。
- 大型机(Mainframe):一种能够处理大量数据和并发用户请求的高性能计算机。它们通常用于需要高可靠性和大规模处理能力的关键业务环境中。
- 小型机:介于个人电脑(PC)和大型机之间的计算机系统。它们比大型机更小、成本更低,但提供了高于普通PC的处理能力和多用户支持。
5、服务规模分类
- 入门级服务器:等同于“PC服务器”
- 工作组服务器:低档服务器,提供小规模(50客户端左右)服务
- 部门级服务器:中档服务器,为100个左右的客户端提供服务
- 企业级服务器:高档服务器,用于数百台以上的客户端访问
四、服务器硬件结构
以华为 TaiShan 200服务器的硬件结构为样例:
1、CPU
(1)CPU定义
CPU:是服务器上的核心处理单元,而服务器是网络中的重要设备,要处理大量的访问需求。因此对服务器具有大数据量的快速吞吐、超强的稳定性、长时间运行等严格要求。所以说CPU是计算机的“大脑”,是衡量服务器性能的首要指标。
- CPU:Central Processing Unit,中央处理器,是一台计算机的运算核心和控制核心。
- CPU、内部存储器和输入/输出设备是电子计算机三大核心部件。
- CPU主要功能是解释计算机指令以及处理计算机软件中的数据。
(2)CPU的组成
CPU由逻辑运算单元、控制单元和存储单元构成。
- 控制器:计算机是根据事先存储的程序对全机实行控制,而程序是指能实现某一功能的指令序列,控制器就是根据指令来对各种逻辑电路发布命令的机构,它是计算机的指挥中心,控制整个CPU的工作,决定计算机运行过程的自动化。
- 运算器:计算机中执行各种算术和逻辑运算操作的部件。运算器的基本操作包括加、减、乘、除四则运算,与、或、非、异或等逻辑操作,以及移位、比较和传送等操作,亦称算术逻辑部件。
- 寄存器:寄存器的主要作用是用来暂时存放参与运算的数据和运算结果,具有接收数据、存放数据和输出数据的功能。
(3)CPU的频率
主频也叫时钟频率,单位是兆赫(MHz)或吉赫(GHz),用来表示CPU的运算、处理数据的速度。
外频是CPU的基准频率,单位是MHz。CPU的外频决定着整块主板的运行速度。
总线频率直接影响CPU与内存数据交换的速度。
倍频系数是指CPU主频与外频之间的相对比例关系。公式:倍频系数=CPU主频/外频
2、内存
内存是电脑中的主要部件,它是相对于外存而言的。我们平常使用的程序,如Windows操作系统、打字软件、游戏软件等,一般都是安装在硬盘等外存上的,必须把它们调入内存中运行,才能真正使用其功能。我们平时输入一段文字,或玩一个游戏,其实都是在内存中进行的。就好比在一个书房里,存放书籍的书架和书柜相当于电脑的外存,而我们工作的办公桌就是内存。通常我们把要永久保存的、大量的数据存储在外存上,而把一些临时的或少量的数据和程序放在内存上。
内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。内存由内存芯片、电路板、金手指等部分组成。
服务器内存插槽及配置原则:
同一台服务器必须使用相同型号的DIMM。
CPU对应的内存槽位上必须至少配置一根内存条。
当服务器配置完全平衡的内存条时,可实现最佳的内存性能。不平衡配置会降低内存性能,因此不推荐使用。
(1)内存定义
存储器按用途可分为主存储器和辅助存储器。
- 主存储器又称内存储器(简称内存),是CPU能直接寻址的存储空间。
- 内存的作用是用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。
- 内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。
- 内存由
内存芯片
、电路板
、金手指
等部分组成。
(2)服务器内存插槽及配置原则:
同一台服务器必须使用相同型号的DIMM。
CPU对应的内存槽位上必须至少配置一根内存条。
当服务器配置完全平衡的内存条时,可实现最佳的内存性能。不平衡配置会降低内存性能,因此不推荐使用。
3、硬盘
硬盘是计算机最主要的存储设备。
(1)硬盘接口
硬盘接口是硬盘与主机系统间的连接部件,作用是在硬盘缓存和主机内存之间传输数据。不同的硬盘接口决定着硬盘与计算机之间的连接速度,直接影响着程序运行快慢和系统性能好坏。
特性/类型 | SATA | SAS | NL-SAS | SSD |
---|---|---|---|---|
主流转速(RPM) | 7,200 | 15,000/10,000 | 7,200 | NA |
串行/并行 | 串行 | 串行 | 串行 | 串行 |
主流容量(TB) | 1 T/2 T/3 T | 0.6 T/0.9 T | 2 T/3 T/4 T | 0.6 T/0.8 T/1.2 T/1.6 T |
MTBF (h) | 1,200,000 | 1,600,000 | 1,200,000 | 2,000,000 |
备注 | 由ATA硬盘发展而来,采用串行的方式传输,SATA3.0实现600 MB/s最高数据传输率。 SATA硬盘年故障率大约2%。 |
SAS专为满足高性能企业需求而设计,并且兼容SATA硬盘。能够提供3.0 Gb/s到6.0 Gb/s的传输率,未来规划到12.0 Gb/s。 SAS硬盘年故障率小于2%。 |
带有SAS接口的“企业级SATA驱动器”,适用于在一个磁盘阵列系统中实现分级存储,简化了磁盘阵列系统的设计。 NL-SAS硬盘年故障率大约2%。 |
固态硬盘是用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元(FLASH芯片、DRAM芯片)组成。 固态硬盘的接口规范和定义、功能及使用方法与普通硬盘完全相同,在产品外形和尺寸上也完全与普通硬盘一致。 |
MTBF:Mean Time Between Failure,平均无故障工作时间。
在价格方面,通常来说SATA和NL-SAS硬盘较为便宜,SAS硬盘较贵一些,SSD最为昂贵。
(2)硬盘组成
组成:盘片,磁头,磁头臂,主轴,接口,控制电路等
逻辑概念:
- 扇区:盘片中的最小单位
- 磁道:同个盘片中同心圆上多个扇区的集合
- 1扇区=512字节
- 2扇区=1K
- 1T= 1024^3*2扇区
4、RAID卡
RAID卡又名磁盘阵列卡,简称阵列卡。
RAID卡的作用:
- 可以将若干硬盘驱动器按照一定要求组成一个整体、由阵列控制器管理的系统。
- 可以提高磁盘子系统的性能及可靠性。
(1)RAID定义
RAID:Redundant Array of Independent Disks,独立硬盘冗余阵列,旧称廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks),简称磁盘阵列。利用虚拟化存储技术把多个硬盘组合起来,成为一个或多个硬盘阵列组,目的为提升性能或数据冗余,或是两者同时提升。
(2)热备(Hot Spare)
热备(Hot Spare)的定义:当冗余的RAID组中某个硬盘失效时,在不干扰当前RAID系统正常使用的情况下,用RAID系统中另外一个正常的备用硬盘自动顶替失效硬盘,及时保证RAID系统的冗余性。
热备一般分为两种:
- 全局式:备用硬盘为系统中所有的冗余RAID组共享。
- 专用式:备用硬盘为系统中某一组冗余RAID组专用。
数据校验,利用冗余数据进行数据错误检测和修复,冗余数据通常采用海明码、异或操作等算法来计算获得。利用校验功能,可以很大程度上提高磁盘阵列的可靠性、高性能和容错能力。不过,数据校验需要从多处读取数据并进行计算和对比,会影响系统性能。
一般来说,RAID不可作为数据备份的替代方案,它对非磁盘故障等造成的数据丢失无能为力,比如病毒、人为破坏、意外删除等情形。此时的数据丢失是相对操作系统、文件系统、卷管理器或者应用系统来说的,对于RAID而言,数据都是完好的,没有发生丢失。所以,数据备份、灾备等数据保护措施是非常必要的,与RAID相辅相成,保护数据在不同层次的安全性,防止发生数据丢失。
5、网卡
网卡,又称为网络适配器或网络接口卡NIC(Network Interface Card),是构成计算机网络系统中最基本的、最重要的、必不可少的连接设备,计算机主要通过网卡接入网络。
(1)网卡主要功能
- 代表固定的网络地址
- 数据的发送与接收
- 数据的封装与解封
- 链路管理
- 编码与译码
(2)华为服务器网卡
热插拔:在不关闭系统,不切断电源的情况下,可以直接进行网卡、电源等的更换。
PCIe(PCI-Express)是继ISA和PCI总线之后的第三代I/O总线,即3GIO。 由Intel在2001年的IDF上提出,由PCI-SIG(PCI特殊兴趣组织)认证发布后才改名为“PCI-Express”。它的主要优势就是数据传输速率高,另外还有抗干扰能力强,传输距离远,功耗低等优点。
- 板载网卡
- 集成在服务器主板的PCH芯片中,不可更换。
- 对外提供2个GE电口+2个10 G光口/电口,集成网卡不占用PCIe插槽。
- 内嵌在服务器主板上,如果网络发生故障,只能通过更换主板的方式去更换网卡。
- PCIe标卡
- 华为有自研及外购的PCIe标卡网卡,可以配置在标准PCIe插槽中。
- 支持热插拔,在不影响服务器正常运行的情况下可以直接进行网卡的更换。
- 灵活IO插卡
- 华为自研网卡,非标准PCIe卡形态,只能用于华为机架服务器。
- Mezz卡
- 刀片服务器计算节点专用Mezz卡,只能用于华为E9000刀片服务器。
6、电源和风扇
支持服务器的电力负载
支持冗余,防止电源故障
- 故障预警和防止
- 故障之前的预防性维护
- 保证服务器持续运行
电源子系统包括:
- 智能电源
- 风扇
冗余电源和风扇
电源冗余特性:
- 1+1:由2个电源模块组成,每个电源承载50%的输出功率,发生故障时,另外一个模块将承担100%的输出功率,允许损坏一块电源模块。
- 1+2:由3个电源模块组成,每个电源承载34%的输出功率,发生故障时,另外两个模块将承担50%的输出功率,允许损坏两块电源模块。
五、服务器关键技术
1、BIOS
BIOS:Basic Input/Output System,基本输入输出系统。
BIOS实际上是固化到计算机中的一组程序,为计算机系统提供最底层的、最直接的硬件控制服务,解决硬件的实时需求。
BIOS是系统内核和硬件层之间桥梁。
(1)BIOS的功能
- 检测和初始化硬件
- 操作系统引导
- 高级电源管理
(2)BIOS特点
- 软件升级、加载和装载功能;
- 基本OAM功能;
- 串口管理功能;
- 故障恢复功能;
- ECC管理功能;
- 硬件诊断功能。
2、IPMI
IPMI是智能型平台管理接口(Intelligent Platform Management Interface)的缩写,是管理基于Intel结构的企业系统中所使用的外围设备采用的一种工业标准,该标准由英特尔、惠普、NEC、美国戴尔电脑和SuperMicro等公司制定。用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。而且更为重要的是IPMI是一个开放的免费标准,用户无需为使用该标准而支付额外的费用。
IPMI:Intelligent Platform Management Interface,智能平台管理接口,是一种开放标准的硬件管理接口规格,定义了嵌入式管理子系统进行通信的特定方法。
IPMI信息通过基板管理控制器(BMC)进行交流,使用低级硬件智能管理而不使用操作系统进行管理。
(1)IPMI的发展
- 1998年Intel、DELL、HP及NEC共同提出IPMI规格,可以透过网路远端控制温度、电压。
- 2001年IPMI从1.0版改版至1.5版,新增PCI Management Bus等功能。
- 2004年Intel发表了IPMI 2.0的规格,能够向下相容IPMI 1.0及1.5的规格。新增了Console Redirection,并可以通过Port、Modem以及LAN远端管理服务器,也加强了安全、VLAN 和刀片服务器的支持性。
3、BMC
BMC:Baseboard Management Controller,主板管理控制单元,是IPMI规范的核心,负责各路传感器的信号采集、处理、储存,以及各种器件运行状态的监控。BMC向机框管理板提供被管理对象的硬件状态及告警等信息,从而实现机框管理模块对被管理对象的设备管理功能。
(1)BMC主要实现以下功能
- 远程控制;
- 告警管理;
- 状态检测;
- 设备信息管理;
- 散热控制;
- 支持ipmitool工具;
- 支持Web界面管理;
- 支持集中账号管理。
(2)iBMC
华为服务器智能管理系统(Huawei Intelligent Baseboard Management Controller,iBMC)是具有完全自主知识产权,面向服务器全生命周期的服务器嵌入式管理系统。
iBMC提供硬件状态监控、部署、节能、安全等系列管理工具,标准化接口构建服务器管理更加完善的生态系统。iBMC基于华为自研的管理芯片Hi1710,采用多项创新技术,全面实现服务器的精细化管理。
iBMC提供了丰富的用户接口,如命令行、基于Web界面的用户接口、IPMI集成接口、SNMP集成接口、Redfish集成接口,并且所有用户接口都采用了认证机制和高度安全的加密算法,保证接入和传输的安全性。
(3)使用
网线连接Mgnt,电脑打开浏览器访问bmc(web管理界面),在bmc上的操作最终由IPMI执行。