1. 文件和档案
1.1. 文件(Document)是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象
1.2. 只有部分文件才能称为档案(Record)
-
1.2.1. 档案可用于证明所做的决策和所采取的行动是符合程序的
-
1.2.2. 可作为组织业务活动和法规遵从的证据
1.3. 档案通常是由人来创建的,但仪器和监控设备也可以提供数据来自动生成档案
1.4. 文件管理
-
1.4.1. 文件管理包括在文件和档案的整个生命周期中控制和组织它们的流程、方法和技术
-
1.4.2. 它包括电子和纸质文件的存储、编目和控制
-
1.4.3. 文件管理关注的是文件本身,几乎不关注文件内容
-
1.4.4. 一个文件中的信息内容可能对如何管理该文件有指导性作用,但是在文件管理中,文件被视为一个单独的实体
-
1.4.5. 市场和监管压力都将重点放在档案保管期限表、地点、传送和销毁上
-
1.4.6. 生命周期
-
1.4.6.1. 编目
> 1.4.6.1.1. 识别已有的和新建的文件/档案
- 1.4.6.2. 制度
> 1.4.6.2.1. 文件/档案制度的创建、批准和实施,包括文件/档案的保管制度
- 1.4.6.3. 分类
> 1.4.6.3.1. 文件/档案的分类
- 1.4.6.4. 存储
> 1.4.6.4.1. 纸质和电子文件/档案的短期和长期存储
- 1.4.6.5. 检索和流转
> 1.4.6.5.1. 在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通
- 1.4.6.6. 保存和处置
> 1.4.6.6.1. 在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁
- 1.4.7. 数据管理专业人员是文件分类和保管决策中的利益相关方,他们必须支持基础结构化数据与特定非结构化数据之间的一致性
1.5. 档案管理
-
1.5.1. 档案管理(Records Management)是文件管理的一部分,管理档案有一些特殊的要求
-
1.5.2. 生命周期
-
1.5.2.1. 从档案的创建或接收到处理、分发、组织和检索,再到处置。档案可以是物理的(如文件、备忘录、合同、报告或缩微胶片)、电子的(如电子邮件内容、附件和即时消息),也可以是网站上的内容及各种介质和硬件上的文件,还可以是各种数据库中采集的数据,甚至是混合档案,如光圈卡(带有嵌入细节或支持材料的缩微胶片窗口的纸质记录)是把各种格式组合在一起
-
1.5.3. 重要档案(Vital Record)是在发生灾难时恢复组织运营所必需的档案
-
1.5.4. 可靠的档案不仅对于档案保存很重要,而且对于遵守法规也很重要
-
1.5.5. 精心管理的档案的特点
-
1.5.5.1. 内容
> 1.5.5.1.1. 内容必须准确、完整和真实
- 1.5.5.2. 背景
> 1.5.5.2.1. 关于档案的创建者、创建日期或与其他档案关系的描述性信息(元数据)应该在创建档案时收集、组织并维护
- 1.5.5.3. 及时性
> 1.5.5.3.1. 档案应该在事件、行为或决定发生后立即创建
- 1.5.5.4. 永久性
> 1.5.5.4.1. 一旦成为档案,则在档案的法定保存期内不能改变其内容
- 1.5.5.5. 结构
> 1.5.5.5.1. 档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上> 1.5.5.5.2. 内容应清晰易读,对术语的使用应始终保持如一
-
1.5.6. 许多档案同时以电子和纸张两种形式存在
-
1.5.6.1. 档案管理要求组织知道哪个副本(电子或纸质)是正式的“档案副本”,以履行档案保存义务
-
1.5.6.2. 一旦档案副本确定下来,其他的副本便可以安全销毁
1.6. 数字资产管理
- 1.6.1. 数字资产管理(Digital Asset Management, DAM)和文件管理流程相似,它专注于存储、跟踪和使用视频、徽标、照片等富媒体文件
2. 数据地图
2.1. 数据地图(Data Map)是所有ESI数据源、应用程序和IT环境的清单,其中包括应用程序所有者、保管人、相关地理位置和数据类型等信息
3. 电子取证
3.1. “取证”(Discovery)是一个法律术语,指诉讼的预审阶段,双方当事人互相要求对方提供信息,以查明案件事实,并了解双方的论点有多强
3.2. 电子文件通常具有元数据(可能不适用于纸质文件),它们在证据中起着重要作用
3.3. 在保全和收集阶段,保全可以确保那些已经被认为是可能相关的数据被置于合法保留状态,以避免被销毁
- 3.3.1. 收集包括以合法的方式从公司获取和转移已辨认的数据并提供给法律顾问
3.4. 处理和审查依赖于分析阶段的结果,但分析被认为是一个单独的阶段,侧重于内容
- 3.4.1. 内容分析的目的是了解诉讼或调查中的情况、事实和潜在证据,以制定应对法律情形的策略
3.5. 原始的信息来源可能是文件、电子表格、电子邮件、数据库、图样、照片、专有应用程序的数据、网站数据、语音邮件等
-
3.5.1. 原生产品(Native Production)保留了文件的原始格式
-
3.5.2. 近原生产品(Near-native Productio)通过提取和转换改变了文件的原始格式
3.6. 字段数据(Fielded Data)是处理ESI生成文本分隔文件和XML加载文件时,从原生文件中提取的元数据和其他信息
4. 信息架构
4.1. 受控词表
4.2. 分类法和本体
4.3. 元数据映射
4.4. 搜索功能规格
4.5. 用例
4.6. 用户流
5. 搜索引擎
5.1. 搜索引擎(Search Engine)是一种根据术语搜索信息并检索内容中包含这些术语网站的软件,如Google
6. 语义模型
6.1. 语义建模(Semantic Modeling)是一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系
7. 语义搜索
7.1. 语义搜索(Semantic Search)侧重于语义和语境而非预先设定的关键字
7.2. 语义搜索引擎可以使用人工智能基于单词及其语境来识别查询匹配
7.3. 语义优化的网络内容包含自然关键词,而不是依赖于严格的关键字插入
7.4. 商务智能(BI)和分析工具的用户通常具有语义搜索的需求
8. 非结构化数据
8.1. 据估计,多达80%的数据存储是在关系型数据库之外维护的
8.2. 非结构化数据有多种电子格式:文字处理文件、电子邮件、社交媒体、聊天室、平面文件、电子表格、XML文件、事务性消息、报告、图形、数字图像、缩微胶片、视频和音频
8.3. 数据管理的基本原则既适用于结构化数据也适用于非结构化数据
8.4. 非结构化数据是宝贵的企业资产
-
8.4.1. 存储、完整性、安全性、内容质量、访问和有效使用对非结构化数据的管理都具有指导作用
-
8.4.2. 非结构化数据需要数据治理、体系架构、安全元数据和数据质量
8.5. 非结构化和半结构化数据对数据仓库和商务智能越来越重要
9. 工作流
9.1. 应该通过一个工作流(Workflow)管理内容开发,以确保内容按时创建并获得适当的批准
9.2. 工作流组件可以包括创建、处理、路由、规则、管理、安全性、电子签名、截止日期、升级(如果出现问题)、报告和交付等过程
9.3. 工作流程需要具有可重复执行的能力,在理想情况下包含对各种内容通用的流程步骤