读DAMA数据管理知识体系指南28文件和内容管理概念(下)

news/2025/3/24 14:02:42/文章来源:https://www.cnblogs.com/lying7/p/18785038

1. 文件和档案

1.1. 文件(Document)是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象

1.2. 只有部分文件才能称为档案(Record)

  • 1.2.1. 档案可用于证明所做的决策和所采取的行动是符合程序的

  • 1.2.2. 可作为组织业务活动和法规遵从的证据

1.3. 档案通常是由人来创建的,但仪器和监控设备也可以提供数据来自动生成档案

1.4. 文件管理

  • 1.4.1. 文件管理包括在文件和档案的整个生命周期中控制和组织它们的流程、方法和技术

  • 1.4.2. 它包括电子和纸质文件的存储、编目和控制

  • 1.4.3. 文件管理关注的是文件本身,几乎不关注文件内容

  • 1.4.4. 一个文件中的信息内容可能对如何管理该文件有指导性作用,但是在文件管理中,文件被视为一个单独的实体

  • 1.4.5. 市场和监管压力都将重点放在档案保管期限表、地点、传送和销毁上

  • 1.4.6. 生命周期

  • 1.4.6.1. 编目

>  1.4.6.1.1. 识别已有的和新建的文件/档案
  • 1.4.6.2. 制度
>  1.4.6.2.1. 文件/档案制度的创建、批准和实施,包括文件/档案的保管制度
  • 1.4.6.3. 分类
>  1.4.6.3.1. 文件/档案的分类
  • 1.4.6.4. 存储
>  1.4.6.4.1. 纸质和电子文件/档案的短期和长期存储
  • 1.4.6.5. 检索和流转
>  1.4.6.5.1. 在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通
  • 1.4.6.6. 保存和处置
>  1.4.6.6.1. 在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁
  • 1.4.7. 数据管理专业人员是文件分类和保管决策中的利益相关方,他们必须支持基础结构化数据与特定非结构化数据之间的一致性

1.5. 档案管理

  • 1.5.1. 档案管理(Records Management)是文件管理的一部分,管理档案有一些特殊的要求

  • 1.5.2. 生命周期

  • 1.5.2.1. 从档案的创建或接收到处理、分发、组织和检索,再到处置。档案可以是物理的(如文件、备忘录、合同、报告或缩微胶片)​、电子的(如电子邮件内容、附件和即时消息)​,也可以是网站上的内容及各种介质和硬件上的文件,还可以是各种数据库中采集的数据,甚至是混合档案,如光圈卡(带有嵌入细节或支持材料的缩微胶片窗口的纸质记录)是把各种格式组合在一起

  • 1.5.3. 重要档案(Vital Record)是在发生灾难时恢复组织运营所必需的档案

  • 1.5.4. 可靠的档案不仅对于档案保存很重要,而且对于遵守法规也很重要

  • 1.5.5. 精心管理的档案的特点

  • 1.5.5.1. 内容

>  1.5.5.1.1. 内容必须准确、完整和真实
  • 1.5.5.2. 背景
>  1.5.5.2.1. 关于档案的创建者、创建日期或与其他档案关系的描述性信息(元数据)应该在创建档案时收集、组织并维护
  • 1.5.5.3. 及时性
>  1.5.5.3.1. 档案应该在事件、行为或决定发生后立即创建
  • 1.5.5.4. 永久性
>  1.5.5.4.1. 一旦成为档案,则在档案的法定保存期内不能改变其内容
  • 1.5.5.5. 结构
>  1.5.5.5.1. 档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上>  1.5.5.5.2. 内容应清晰易读,对术语的使用应始终保持如一
  • 1.5.6. 许多档案同时以电子和纸张两种形式存在

  • 1.5.6.1. 档案管理要求组织知道哪个副本(电子或纸质)是正式的“档案副本”​,以履行档案保存义务

  • 1.5.6.2. 一旦档案副本确定下来,其他的副本便可以安全销毁

1.6. 数字资产管理

  • 1.6.1. 数字资产管理(Digital Asset Management, DAM)和文件管理流程相似,它专注于存储、跟踪和使用视频、徽标、照片等富媒体文件

2. 数据地图

2.1. 数据地图(Data Map)是所有ESI数据源、应用程序和IT环境的清单,其中包括应用程序所有者、保管人、相关地理位置和数据类型等信息

3. 电子取证

3.1. “取证”(Discovery)是一个法律术语,指诉讼的预审阶段,双方当事人互相要求对方提供信息,以查明案件事实,并了解双方的论点有多强

3.2. 电子文件通常具有元数据(可能不适用于纸质文件)​,它们在证据中起着重要作用

3.3. 在保全和收集阶段,保全可以确保那些已经被认为是可能相关的数据被置于合法保留状态,以避免被销毁

  • 3.3.1. 收集包括以合法的方式从公司获取和转移已辨认的数据并提供给法律顾问

3.4. 处理和审查依赖于分析阶段的结果,但分析被认为是一个单独的阶段,侧重于内容

  • 3.4.1. 内容分析的目的是了解诉讼或调查中的情况、事实和潜在证据,以制定应对法律情形的策略

3.5. 原始的信息来源可能是文件、电子表格、电子邮件、数据库、图样、照片、专有应用程序的数据、网站数据、语音邮件等

  • 3.5.1. 原生产品(Native Production)保留了文件的原始格式

  • 3.5.2. 近原生产品(Near-native Productio)通过提取和转换改变了文件的原始格式

3.6. 字段数据(Fielded Data)是处理ESI生成文本分隔文件和XML加载文件时,从原生文件中提取的元数据和其他信息

4. 信息架构

4.1. 受控词表

4.2. 分类法和本体

4.3. 元数据映射

4.4. 搜索功能规格

4.5. 用例

4.6. 用户流

5. 搜索引擎

5.1. 搜索引擎(Search Engine)是一种根据术语搜索信息并检索内容中包含这些术语网站的软件,如Google

6. 语义模型

6.1. 语义建模(Semantic Modeling)是一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系

7. 语义搜索

7.1. 语义搜索(Semantic Search)侧重于语义和语境而非预先设定的关键字

7.2. 语义搜索引擎可以使用人工智能基于单词及其语境来识别查询匹配

7.3. 语义优化的网络内容包含自然关键词,而不是依赖于严格的关键字插入

7.4. 商务智能(BI)和分析工具的用户通常具有语义搜索的需求

8. 非结构化数据

8.1. 据估计,多达80%的数据存储是在关系型数据库之外维护的

8.2. 非结构化数据有多种电子格式:文字处理文件、电子邮件、社交媒体、聊天室、平面文件、电子表格、XML文件、事务性消息、报告、图形、数字图像、缩微胶片、视频和音频

8.3. 数据管理的基本原则既适用于结构化数据也适用于非结构化数据

8.4. 非结构化数据是宝贵的企业资产

  • 8.4.1. 存储、完整性、安全性、内容质量、访问和有效使用对非结构化数据的管理都具有指导作用

  • 8.4.2. 非结构化数据需要数据治理、体系架构、安全元数据和数据质量

8.5. 非结构化和半结构化数据对数据仓库和商务智能越来越重要

9. 工作流

9.1. 应该通过一个工作流(Workflow)管理内容开发,以确保内容按时创建并获得适当的批准

9.2. 工作流组件可以包括创建、处理、路由、规则、管理、安全性、电子签名、截止日期、升级(如果出现问题)​、报告和交付等过程

9.3. 工作流程需要具有可重复执行的能力,在理想情况下包含对各种内容通用的流程步骤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/904044.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AMD Instinct™MI300系列微架构

AMD Instinct™MI300系列微架构 AMD Instinct MI300系列加速器基于AMD CDNA 3架构,旨在为HPC、人工智能(AI)和机器学习(ML)工作负载提供领先性能。AMD Instinct MI300系列加速器非常适合极端的可扩展性和计算性能,可以在单个服务器到世界上最大的EB级超级计算机的所有设备…

节点级架构与MI300和MI200系列性能计数器和指标

节点级架构 MI300系列节点级架构,显示了8个完全互连的MI300X OAM模块,通过重定时器和HGX连接器连接到(可选)PCIEe交换机。 如图5-9所示,显示了具有双插槽配置的AMD EPYC处理器和八个AMD Instinct MI300X加速器的系统的节点级架构。MI300X OAM通过PCIe Gen 5 x16链路(黄线…

推荐专著《AI芯片开发核心技术详解》(1)、《智能汽车传感器:原理设计应用》(2)、《TVM编译器原理与实践》(3)、《LLVM编译器原理与实践》(4)

4本书推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理设计应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该…

GPU到GPU通信选项

GPU到GPU通信选项 将讨论使用AMD Instinct™MI250和AMD InstinctTM MI250X GPU的系统中的GPU到GPU通信选项。每个MI250(X)GPU由两个图形计算芯片(GCD)组成。如图4-20所示,显示了具有4个MI250 GPU(8个GCD)的节点的示意图。每个绿色框代表一个MI250 GPU和两个GCD。GCD通过…

2025年3月月记

2025.3.1 新的一月到来啦!今天干了个啥呢?好像没干啥也是把昨天编程学习的作业做了,待会又要去学S组的知识了,我先去刷题了。。。 OK啊,也是把课学完了,待会我又要去打atcoder了,今天学的是差分约束,其实就是图上的知识,主要的表达形式是:u <= v + w或者u >= v…

Linux版本的MAT(Eclipse Memory Analyzer)内存分析工具使用

首先先下载对应平台的工具 官方地址:https://eclipse.dev/mat/download/ 因为我是arm的架构 所以下载的是arm64的安装包 下载完成后解压 得到以下内容 先修改初始化的启动的内存大小 vim MemoryAnalyzer.ini 主要修改这个值 这个要尽量大点 不然我们的内存分析文件很大 会执行…

【CodeForces训练记录】Codeforces Round 1011 (Div. 2)

训练情况赛后反思 B题因为分讨的问题WA了一发,异或还是不大会做 A题 猜猜题,显然对于字符串全部都是一个字母的,无论怎么换字典序都不可能更小,对于其他情况因为可以选择两个字母互换,我们容易观察到对于某一个字符串一定存在一种换法能让字典序更小(无非就是换头或者换尾…

集美大学课程实验报告-实验3:栈、队列与递归

集美大学课程实验报告-实验3:栈、队列与递归项目名称 内容课程名称 数据结构班级 网安2413指导教师 郑如滨学生姓名 林沁茹学号 202421336067实验项目名称 实验3:栈、队列与递归上机实践日期上机实践时间 2学时一、目的(本次实验所涉及并要求掌握的知识点) 以下内容请根据实…

2025-03-22 闲话

2025-03-22 闲话有些闲话是纪实的,它们可能只是平淡的文字。它们可能没有感受,不带思考。你看不到装饰,只有琐碎、补也补不到自圆其说的细节。柴米油盐大抵是这样的。 来北京独居后的生活着实安逸。每天执行一个蛮正常的作息,保证三顿饮食、偶尔晚上和网友去搓搓夜宵。睡觉…

3.22 三重积分计算方法

三重积分的实际意义:计算一个立体的质量(可以) 1 投影法(先一后二)(一个土豆切成土豆丝,最后再累加Dxy平面) 一个立体图形可以看成是两个曲面拼接而成,z=(x,y)可表示一个曲面假设x和y都是确定的,然后就累加z,最后再算面积分 先假设有一条竖线,注意竖线是从哪里进入…

15.数组

数组C 语言支持数组数据结构,它可以存储一个固定大小的相同类型元素的顺序集合。 数组是用来存储一系列数据,但它往往被认为是一系列相同类型的变量。数组中的特定元素可以通过索引访问,第一个索引值为 0。声明数组在 C 中要声明一个数组,需要指定元素的类型和元素的数量 下…

逆向中简单的shellcode

做题时遇到了,简单记录一下 一,介绍: shellcode分为广义和狭义,狭义指的仅仅是通过命令行shell攻击靶机,并取得控制权的代码,广义的指能完成类似任务的代码,通常是汇编/机器码。 不过这里是RE,不是PWN,所以不会有靶机,那么在下文指的是广义的shellcode,注入程序,控…