读数据保护:工作负载的可恢复性11传统数据源中的数据

news/2024/12/12 6:52:44/文章来源:https://www.cnblogs.com/lying7/p/18596861

1. 传统数据源中的数据

1.1. 需要备份的数据分散在各种地方

  • 1.1.1. 有些数据源是大家都能意识到的

    • 1.1.1.1. 即便在大家都能想到的这些数据源里,仍然会有一些容易忽视的问题
  • 1.1.2. 有一些不那么明显

2. 实体服务器

2.1. 以前,我们把实体服务器直接叫作服务器,不会专门强调“实体”(physical)二字,因为这是默认的

2.2. 现在要是再说起这种服务器,那就必须特意指出,这个服务器是用一台真实的计算机打造的

2.3. 实体服务器也有可能由大型机(mainframe)或小型机(minicomputer)来充当

  • 2.3.1. 大型机与小型机都没有消亡

2.4. 标准备份

  • 2.4.1. 把这个服务器提供服务所需的数据备份下来,以便在必要时恢复

  • 2.4.2. 开源的备份工具

    • 2.4.2.1. BackupPC

    • 2.4.2.2. Bacula

    • 2.4.2.3. Amanda

2.5. 裸机备份

  • 2.5.1. 重点在于以后如何恢复实体服务器本身

  • 2.5.2. 如果服务器本身出现了故障,那你必须先更换硬件、重装操作系统并重新配置该系统,然后才能恢复数据,这要比仅恢复数据复杂得多

  • 2.5.3. 最大的难点在于,如何从服务器的启动盘里收集并存储启动计算机所需的信息

  • 2.5.4. 有效的裸机恢复流程

    • 2.5.4.1. 首先要更换硬件

    • 2.5.4.2. 然后进入相关环节,以恢复底层的操作系统

    • 2.5.4.3. 接着可能还会单独安排另一个恢复流程,以恢复应用程序及其数据

    • 2.5.4.4. 最后重启服务器

  • 2.5.5. 虚拟机技术出现之后,我们就很少在实体服务器上做裸机恢复了,而且裸机恢复也有了它自己的地位,并不需要像以前那样跟裸机备份合起来讨论

2.6. 备份NAS

  • 2.6.1. NAS filer是一种特制的实体服务器,很多数据中心里都有这种服务器,你在备份并恢复这些服务器时,通常需要专门做一些处理

  • 2.6.2. 使用proxy

    • 2.6.2.1. NAS服务器分享文件时所用的协议主要有两种,也就是NFS与SMB

      2.6.2.1.1. 前者适用于UNIX/Linux操作系统

      2.6.2.1.2. 后者适用于Windows操作系统

    • 2.6.2.2. 优点在于,这些文件对备份系统来说跟其他文件差不多,因此无论它们位于何处,备份系统都能予以恢复

    • 2.6.2.3. 缺点在于,filer无法区分备份流量与用户流量,由于它不知道访问者究竟是备份程序,还是普通的用户,因此无法调整这两种请求之间的次序,让普通用户优先得到服务

  • 2.6.3. 通过NDMP(Network Data Management Protocol,网络数据管理协议)备份

    • 2.6.3.1. 由NAS行业提出的一种专门用来备份NAS filer的协议

    • 2.6.3.2. 最大缺点在于,每个filer厂商都有可能按它们自己的格式来备份,那些格式互不相同

  • 2.6.4. 做快照并将其复制到其他的NAS filer上

    • 2.6.4.1. 使用设备厂商所提供的快照系统建立快照,并将其复制到另一个filer上

    • 2.6.4.2. filer厂商都很喜欢你采用这种方式来备份,这意味着你要再买一台这个品牌的filer

    • 2.6.4.3. 对原始数据的快照做复制,并采用这个复制出来的快照做恢复,其速度几乎总是要比其他方式更快

  • 2.6.5. NAS filer也可以作为块设备连接到其他服务器

3. 虚拟服务器

3.1. 虚拟服务器是以虚拟机(Virtual Machine, VM)的形式出现的服务器

3.2. 虚拟机是一种专门模拟实体机(physical machine,也就是物理机或真机)的东西

3.3. 必须给实体机的操作系统安装一种叫作虚拟机管理器(hypervisor)的软件

  • 3.3.1. 虚拟机管理器软件是运行在宿主机(host machine,也就是承载这些虚拟机的那台实体机)的操作系统上的一个软件,它能够将宿主机当成许多个虚拟的机器使用,让每个虚拟机都能安装各自的操作系统

  • 3.3.2. 实体机叫作宿主计算机(host computer)、宿主节点(host node)、虚拟机管理器节点(hypervisor node)等

  • 3.3.3. vSphere

  • 3.3.4. Hyper-V

  • 3.3.5. KVM

  • 3.3.6. Xen

  • 3.3.7. AHV(Acropolis HyperVisor)

3.4. 备份服务器或虚拟机需要花费一定的时间,虚拟机越大,花的时间就越长

3.5. 把虚拟机当成实体机来备份

  • 3.5.1. 虚拟机技术刚诞生的时候,还没有出现后面要讲的那种虚拟机管理器层面的备份手法,因此我们当时只能将它当作实体机来备份

  • 3.5.2. 把虚拟机当成实体机来备份,最严重的问题就在于备份过程中需要执行大量的I/O操作

3.6. Windows操作系统的VSS

  • 3.6.1. 是Windows系统的一种特殊快照机制,让备份软件能够以application-consistent方式备份文件系统或运行在Windows中的应用程序

  • 3.6.2. crash-consistent(​“崩溃一致的”​)方式

    • 3.6.2.1. 把这些正在发生变化的东西在某一个时间点(例如系统即将崩溃的那一刻)所处的状态备份下来,这就相当于你把服务器的电源关了,并且设法对该服务器在关机的那一刻所处的状态予以备份
  • 3.6.3. application-consistent(​“应用程序一致的”​)方式

    • 3.6.3.1. 它总是能够保证应用程序可以从这样的备份里恢复

    • 3.6.3.2. 对于应用程序来说,采用这种方式备份会更好一些

  • 3.6.4. 在执行备份之前先给需要备份的这个应用程序制作快照

  • 3.6.5. 等到所有的VSS Writer都把各自的快照做好之后,备份软件就开始使用这些快照制作备份

  • 3.6.6. 做完备份就把日志截断,这是相当常见的操作,备份软件可以先向VSS提出备份请求,然后根据获取到的快照执行备份,最后再给VSS提一个请求,让它把事务日志截断

3.7. 采用专门的手法来备份虚拟机

  • 3.7.1. VADP

    • 3.7.1.1. vSphere Storage API for Data Protection(VADP),所有版本的VMware都支持这套API,这包括企业内部的vSphere以及云端的VMware Cloud,后者能够运行在许多云平台中

    • 3.7.1.2. vSphere可以说是一款能够运行在Linux之类的操作系统里的特殊应用程序

      3.7.1.2.1. 特殊之处在于,这种应用程序的用途是把宿主机当成多个虚拟机来使用,并管理这些虚拟机

  • 3.7.2. Linux系统没有跟VSS相似的机制

    • 3.7.2.1. 如果你要备份的VMware虚拟机运行的是Linux系统,那么备份软件依然可以先跟VADP对接,但是接下来,VADP无法与一个类似于VSS的机制对接
  • 3.7.3. Hyper-V与VSS

    • 3.7.3.1. Hyper-V则可以说是一款能够运行在Windows操作系统里的特殊应用程序

    • 3.7.3.2. 它是运行在Windows系统里的,因此这意味着它可以使用该系统的VSS机制,具体来说,它有一个专为使用该机制而设的VSS Writer

  • 3.7.4. 基于快照的备份

  • 3.7.5. HCI

    • 3.7.5.1. 在HCI(Hyper-Converged Infrastructure,超融合基础架构)系统里运行的,这是一种专门为运行虚拟机管理器而设计的特殊硬件,它能够与存储设备相集成

    • 3.7.5.2. 各种HCI系统所提供的备份工具在制作备份的办法上可能有所区别,但最为常见的一种办法依然是通过快照制作备份

    • 3.7.5.3. HCI系统把运算、网络与存储等单元都封装到了一起,而且通常还会把基于快照的数据保护机制也包含进来

    • 3.7.5.4. 采用支持这种虚拟机管理器的备份软件来制作备份

    • 3.7.5.5. 采用HCI产品所内置的数据保护功能来制作备份

  • 3.7.6. 融合基础架构(Converged Infrastructure, CI)也是专门为运行虚拟机管理器而设计的系统,然而这种系统通常比较大,它所融合的产品是分别由多家厂商生产的,而不像超融合基础架构(HCI)那样,只采用来自同一个厂商的产品

    • 3.7.6.1. 使用的通常都是标准的虚拟机管理器,而且搭配的也是标准的数据保护工具,因此没有什么特殊的备份方式需要专门讲解

4. 台式机与笔记本计算机

4.1. 只用来充当缓存的笔记本计算机

  • 4.1.1. Chromebook就是典型的例子,这只是一个用来访问Google Workspace的工具而已

  • 4.1.2. 如果你的笔记本计算机也像这样,根本不保存任何数据(注意,是“根本不保存任何数据”​)​,不会建议你去备份它

4.2. 普通台式机与笔记本计算机

  • 4.2.1. 备份笔记本计算机,还可以让计算机的升级过程更加顺畅

    • 4.2.1.1. 如果给计算机做了备份,那么这些操作就不用重新执行一遍了,所以这一优势尤其明显

4.3. 备份方式

  • 4.3.1. 用移动硬盘备份

    • 4.3.1.1. 除了那种根本不做备份的办法之外,这是最差的一种办法

    • 4.3.1.2. 违背了3-2-1原则,因为存放备份的这个移动硬盘,通常就在你要备份的那个计算机旁边,而该原则要求你至少将其中一个备份放在别处

    • 4.3.1.3. 大多数故障其实都发生在移动硬盘上

    • 4.3.1.4. 这种设备动不动就会坏掉,所以用它们备份是很不可靠的

    • 4.3.1.5. 会将成千上万条企业数据的副本,都以未加密的形式保存在这块移动硬盘里

    • 4.3.1.6. 绝对不要用移动硬盘备份企业数据

  • 4.3.2. 做文件级的增量备份

    • 4.3.2.1. 传统的备份软件是在文件层面备份数据的,这对于局域网中的台式机或许可行,但并不适用于笔记本计算机
  • 4.3.3. 通过文件同步与分享工具备份

    • 4.3.3.1. 用文件同步与分享工具做备份,还有一个坏处在于IT人员无法集中控制备份操作,也没有办法监控备份进度,因而无法确保备份机制是否还在正常运作

    • 4.3.3.2. 同步与分享工具唯一的可取之处在于,它们是某个你已经使用了的产品所提供的附加功能

  • 4.3.4. 采用结合了源端去重技术的备份系统或服务来做备份

    • 4.3.4.1. 只有这个办法,才能够真正给台式机与笔记本计算机做备份

    • 4.3.4.2. 源端去重能够尽量缩减备份时需要传输的数据量,因此对终端设备的性能几乎没有太大的影响

    • 4.3.4.3. 备份时只会对终端用户造成很小的影响,甚至根本不会影响终端用户

    • 4.3.4.4. 可以利用源端去重技术缩减传输备份所需的带宽

    • 4.3.4.5. 能够做端到端的加密

    • 4.3.4.6. 能够保护设备免受勒索攻击

5. 移动设备

5.1. 如果该设备只充当云平台的缓存,那就无须备份

5.2. 如果你要在这种设备上创建并存储对公司有用的数据,那就应该备份

5.3. 把数据同步到云平台

  • 5.3.1. 确保用户只使用那种能够将数据同步到云平台的应用程序(这个云平台由设备厂商提供)​

5.4. 把数据同步到实体机再备份

5.5. 在移动设备上备份

5.6. 移动设备管理

  • 5.6.1. 移动设备管理(Mobile Device Management, MDM)

  • 5.6.2. 把一款特制的应用程序安装在这种设备上,让这个应用程序持有与本组织相关的所有数据,并要求员工必须把他们为本组织创建的数据放在这个应用程序里面

  • 5.6.3. 这款特制的应用程序可以决定自己应该如何处理这些数据

    • 5.6.3.1. 可以先把数据加密,然后再保存到手机上

    • 5.6.3.2. 可以把数据复制到某个集中存放公司数据的地方,以便用其他手段予以保护

  • 5.6.4. 基于MDM的系统还能够远程删除某个设备上的数据

  • 5.6.5. 从备份的角度来看,这种方案确实能够保护数据,而且不用担心设备丢失之后其中的数据会让其他人看到,因为这些数据能够远程删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/851173.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GoAccess :一款出色的开源网络日志分析工具

GoAccess 是一款出色的开源网络日志分析工具。它支持多种主流软件日志格式,如 Apache、Nginx 等。基于 C 语言构建,具备实时分析能力,能快速处理日志数据并生成可视化报告,无论是终端展示还是 HTML、JSON、CSV 格式输出,都为网络运维与业务优化提供有力支持。官网地址:ht…

canvas生成图片有没有跨域问题?如果有如何解决?

Canvas 生成图片本身不会直接导致跨域问题,但是如果 Canvas 使用的图片资源来自不同的域,就会出现跨域问题。 这是因为浏览器出于安全考虑,限制了从一个域加载的脚本访问另一个域的资源。 具体来说,如果你的 Canvas 画布绘制了来自其他域的图片,然后你试图使用 toDataURL…

如何垂直居中`img`?

有多种方法可以垂直居中 <img> 元素,选择哪种方法取决于 <img> 元素的上下文以及你想要达到的具体效果。以下是一些常用的技巧: 1. Flexbox: 这是现代布局中最推荐的方法,因为它简洁且灵活。 <div style="display: flex; align-items: center; justify…

ubuntu20.04.6配置虚拟VCAN

开启vcan设备的命令: sudo ip link add dev vcan0 type vcan 如果没有vcan模块,则先用modprobe命令生成vcan模块: sudo modprobe vcan 如果模块/lib/modules/linux-headers-$(uname -r)下没有vcan.ko,则无法创建vcan模块,需安装linux-headers-$(uname -r): sudo apt inst…

ubuntu20.04.6虚拟机workstation网络配置

步骤1: 设置VMware workstation的虚拟网络编辑器,添加NAT网络:步骤2: 在本地真实主机上设置设置虚拟网络共享,允许其他机器通过本机访问网络。步骤3: 将在创建的虚拟机上配置网络,如下图:图中位置鼠标右键选择设置,将网络改为custom自定义-nat模式

新型知识付费生态系统

新型知识付费生态系统作为教育与软件行业的融合产物,已经成为推动知识传递与商业成功的核心驱动力之一。该生态系统通过一系列前沿科技应用来提升学习体验并实现资源的最佳匹配,从而重塑了在线教育行业的面貌。下面对知识付费在线教育系统的背景、现状和未来趋势进行全面分析…

转载:【AI系统】LLVM 架构设计和原理

在上一篇文章中,我们详细探讨了 GCC 的编译过程和原理。然而,由于 GCC 存在代码耦合度高、难以进行独立操作以及庞大的代码量等缺点。正是由于对这些问题的意识,人们开始期待新一代编译器的出现。在本文,我们将深入研究 LLVM 的架构设计和原理,以探索其与 GCC 不同之处。 …

山西在线教育系统公司

山西在线教育系统行业在近年来展现出蓬勃的发展态势。众多企业在这一领域积极探索并不断推陈出新。以山西交通在线教育培训平台为例,该平台不仅为交通运输系统的党员干部提供了高质量的线上直播培训课程,还显著提高了其学习效果与便捷度。山西在线教育系统作为教育的重要组成…

论文解读-A Comprehensive Survey on Graph Neural Networks

论文介绍论文是2019年定稿的,算是比较陈旧的论文,综述性质的论文。 论文发表于IEEE Transactions on Neural Networks and Learning Systems, 2021。质量挺高的。 论文主要工作论文提出了一个新的图神经网络的分类方法,把图神经网络分为四类:循环图神经网络,卷积图神经网…

基于GoogleNet深度学习网络的手语识别算法matlab仿真

1.算法运行效果图预览 (完整程序运行后无水印)手语How are you,测试识别结果如下:手语I am fine,测试识别结果如下:手语I love you,测试识别结果如下: 2.算法运行软件版本 matlab2022a3.部分核心程序 (完整版代码包含详细中文注释和操作步骤视频)%% Dataset = imageDat…

vxe-table 实现任意列拖拽排序

vxe-table 实现任意列拖拽排序,通过 column-drag-config.isCrossDrag 启用任意列拖拽排序,除了自身之外。 官网:https://vxetable.cn启用后可以在不同表头直接任意拖拽,需要注意所有列必须有 field 属性 <template><div><vxe-grid v-bind="gridOptions…

医疗花费预测(保姆级教程)

目标 想要一开始快速抓住一个实验的方向,我觉得一个好方法就是抓住实验目的。 本实验:根据一个人的年龄、性别、BMI、子女个数、是否吸烟和生活地区,预测这个人在医疗方面花费的金额。 线性回归 这里我想问个问题,线性回归是什么,或者说针对于DBSCAN聚类算法之后得到的样本…