BIG DATA —— 大数据时代

大数据时代

[英] 维克托 · 迈尔 — 舍恩伯格     肯尼斯 · 库克耶 ◎ 著  盛杨燕     周涛◎译

《大数据时代》是国外大数据研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用第一人”,他在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。

舍恩伯格最具洞见之处在于,指出大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。

本书认为大数据的核心就是预测,大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

                                                                                                                                          —— 网络

 读后感

引言

        在一开始作者举例在流感中之所以谷歌可以预测冬季流感的传播。 就是因为谷歌保存了每天来自全球的30亿条搜索指令。奥伦 · 埃奇奥尼通过大数据解释了为什么季节影响飞机票的价格,他把这个发现命名为 “哈姆雷特”。于是他收购了Farecast公司,这时的预测准确率已经高达75%, 平均每张机票节省50美元。

天文学,信息爆炸的起源

信息爆炸的起源可以追溯到多个领域的发展,而天文学是其中的一个重要领域。随着计算机技术的全面融入和社会的发展,天文学在数据收集和处理方面取得了巨大的进步。在这个过程中,天文学家们积累了大量的观测数据,这些数据主要依赖于观测电磁辐射获得。这些数据的增长速度非常快,远超过了传统数据处理和分析的能力,从而形成了信息爆炸的现象。

具体来说,天文学作为信息爆炸的起源之一,主要体现在以下几个方面:

  1. 观测技术的进步:随着望远镜和探测器技术的不断改进,天文学家能够观测到更远的星系、更暗的天体和更精细的结构。这些观测技术的进步使得数据量迅速增长,为信息爆炸提供了丰富的原始素材。
  2. 数据处理技术的发展:随着计算机技术的不断进步,数据处理和分析能力得到了极大的提升。这使得天文学家能够更高效地处理和分析大量的观测数据,从而发现更多的天文现象和规律。
  3. 跨学科的合作与交流:天文学与其他学科的交叉融合,如物理学、数学、计算机科学等,为信息爆炸提供了更多的可能性。这些跨学科的合作与交流促进了数据共享和资源整合,进一步推动了信息爆炸的发展。

                                                                                                                                           ——网络

国际单位制前缀&字节

在书中多次提到国际单位制(SI)前缀

  1. 千(kilo):10³        或者1000
  2. 百万(mega):10⁶ 或者1,000,000
  3. 十亿(giga):10⁹   或者1,000,000,000
  4. 兆(tera):10¹²      或者1,000,000,000,000
  5. 拍(peta):10¹⁵     或者1,000,000,000,000,000
  6. 艾(exa):10¹⁸      或者1,000,000,000,000,000,000
  7. 泽(zetta):10²¹    或者1,000,000,000,000,000,000,000
  8. 尧(yotta):10²⁴    或者1,000,000,000,000,000,000,000,000
  9. 毫(milli):10⁻³     或者0.001
  10. 微(micro):10⁻⁶  或者0.000001
  11. 纳(nano):10⁻⁹   或者0.000000001
  12. 皮(pico):10⁻¹²   或者0.000000000001
  13. 飞(femto):10⁻¹⁵ 或者0.000000000000001
  14. 厄(atto):10⁻¹⁸    或者0.000000000000000001
  15. 兹(Zepto):10⁻²¹ 或者0.000000000000000000001
  16. 幺(Yocto):10⁻²⁴ 或者0.000000000000000000000001

据了解人类在2007年就储存了300艾字节

字节 Byte:

1Byte = 8bit, 俗称1大B = 1小b。

Byte进制是1024,艾字节到泽字节的进位就是1024 = 2¹⁰。

 模拟数据&数字数据

众所周知使用东西是一般分为获取数据——传输数据——处理数据——发挥作用

模拟数据和数字数据是两种主要的数据类型,它们在表示、传输和处理数据时有显著的不同。

模拟数据(Analog Data)是指连续变化的数据,它们可以取任意值,并且在时间和幅度上都是连续的。例如,温度、压力、声音、图像等都属于模拟数据。模拟数据的特点是可以平滑地变化,没有固定的量化级别。这种类型的数据通常通过模拟信号进行传输,如电话线中的语音信号或电视广播中的图像信号。

数字数据(Digital Data)则是以离散的数值形式表示的数据。在计算机科学中,数字数据通常是用二进制代码(0和1)表示的。这种数据类型只能取特定的、离散的数值。0表示恒定的负电压,1表示恒定的正电压。

 作者一直强调量变 = 质变,全数据模式 样本 = 总体这是很正确的, 作者在书中举例一个图片和一个视频有什么区别(量变 = 质变)。

我推荐大家看一下这本书:

谢谢大家,欢迎点赞, 收藏,关注。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/473400.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python-自动化篇-运维-网络-IP

文章目录 IP自我介绍IPy安装模块windowsLinux IPy介绍支持大多数 IP 地址格式IPv4 地址IPv6 地址网络掩码和前缀 派生网络地址将地址转换为字符串使用多个网络多网络计算方法 IP自我介绍 IP地址规划是网络设计中非常重要的一个环节,规划的好坏会直接影响路由协议算…

2024年【天津市安全员B证】考试技巧及天津市安全员B证复审模拟考试

题库来源:安全生产模拟考试一点通公众号小程序 2024年天津市安全员B证考试技巧为正在备考天津市安全员B证操作证的学员准备的理论考试专题,每个月更新的天津市安全员B证复审模拟考试祝您顺利通过天津市安全员B证考试。 1、【多选题】《建设行政处罚决定…

力扣刷题之旅:进阶篇(六)—— 图论与最短路径问题

力扣(LeetCode)是一个在线编程平台,主要用于帮助程序员提升算法和数据结构方面的能力。以下是一些力扣上的入门题目,以及它们的解题代码。 --点击进入刷题地址 引言 在算法的广阔天地中,图论是一个非常重要的领域。…

《Go 简易速速上手小册》第8章:网络编程(2024 最新版)

文章目录 8.1 HTTP 客户端与服务端编程 - Go 语言的网络灯塔与探航船8.1.1 基础知识讲解服务端编程客户端编程 8.1.2 重点案例:简易博客服务服务端实现客户端实现运行示例 8.1.3 拓展案例 1:增加文章评论功能功能描述服务端实现客户端实现 8.1.4 拓展案例…

MATLAB导出图程序

本文将以代码的形式快速介绍MATLAB导出图到Paper 1 从simulation导出数 2 与simulation同源文件夹下创建导图m文件 代码如下: % 实验后的数据处理用 M-文件 % clear all % 清空工作空间 % close all      % 关闭所有图形窗口 % load adp.mat …

二叉树前序中序后序遍历(非递归)

大家好,又和大家见面啦!今天我们一起去看一下二叉树的前序中序后序的遍历,相信这个对大家来说是信手拈来,但是,今天我们并不是使用常见的递归方式来解题,我们采用迭代方式解答。我们先看第一道前序遍历 1…

把Activity当做dialog对话框使用

1、引言 在安卓开发中对话框的使用是不可避免的,但是原生的对话框用起来总感觉差点意思,而且位置不好控制,在与界面的交互上也不够灵活,没有像activity那样的生命周期方法,以至于某些特殊的功能无法实现。此时我们就希…

MySQL 基础知识(八)之用户权限管理

目录 1 MySQL 权限管理概念 2 用户管理 2.1 创建用户 2.2 查看当前登录用户 2.3 修改用户名 2.4 删除用户 3 授予权限 3.1 授予用户管理员权限 3.2 授予用户数据库权限 3.3 授予用户表权限 3.4 授予用户列权限 4 查询权限 5 回收权限 1 MySQL 权限管理概念 关于 M…

太以假乱真了,大家小心

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

「算法」滑动窗口

前言 算法需要多刷题积累经验,所以我行文重心在于分析解题思路,理论知识部分会相对简略一些 正文 滑动窗口属于双指针,这两个指针是同向前行,它们所夹的区间就称为“窗口” 啥时候用滑动窗口? 题目涉及到“子序列…

数据结构之时空复杂度

一、前言 1)什么是数据结构 数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的 集合。 2)什么是算法 算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入&am…

开年炸裂-Sora/Gemini

最新人工智能消息 谷歌的新 Gemini 模型 支持多达 1M的Token,可以分析长达一小时的视频 1M Token可能意味着分析700,000 个单词、 30,000 行代码或11 小时的音频、总结、改写和引用内容。 Comment:google公司有夸大的传统,所以真实效果需要上…