Data Stream 复习(考试向)

Data Stream Review

  • Overall
  • Uniform Sampling
  • Bloom Filter
  • Misra-Gries Algorithm
  • CountMin Sketch Algorithm
  • Count Sketch Algorithm

Overall

在这里插入图片描述

Uniform Sampling

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Bloom Filter

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
一个箱子没有球的概率可以表示为 (1 - 1/n)^m 的原因是基于以下逻辑:

  1. 对于第一个球,它可以被放入 n 个箱子中的任何一个,因此每个箱子都有 1/n 的概率收到第一个球。

  2. 对于第二个球,同样地,每个箱子都有 1/n 的概率收到第二个球,因为球被放入箱子的概率是相同的,而且与之前球放在哪个箱子无关。

  3. 对于第三个球,同样地,每个箱子都有 1/n 的概率收到第三个球,以此类推。

因此,每个球被放入一个箱子的概率都是 1/n,而且这些概率是相互独立的,因为一个球的放置不受另一个球的放置影响。

要计算一个箱子没有球的概率,我们可以考虑它不收到任何球的概率。这就相当于每个球都不被放入这个箱子的概率,即 (1 - 1/n)。因为每个球的放置是相互独立的,所以多个球都不被放入这个箱子的概率就是这些独立事件的乘积。

所以,一个箱子没有球的概率是 (1 - 1/n)^m,其中 m 是球的数量,n 是箱子的数量。这个公式表示了每个箱子都至少有一个球的补集的概率。

在这里插入图片描述

Misra-Gries Algorithm

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

CountMin Sketch Algorithm

Count-Min Sketch 是数据库中用到的一种Sketch,所谓sketch 就是用很少的一点数据来描述全体数据的特性,牺牲了准确性但是代价变得很低。
CM-Sketch 的内部数据结构是一个二维数组count,宽度w,深度d,此外还需要d个两两独立的哈希函数h1…hd 更新的时候,用这些哈希函数算出d个不同的哈希值,然后把对应的行的值加上

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
W: hash之后的值域,即0,1,2
D:hash函数的数量

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Count Sketch Algorithm

运行sketch方法k次,每次对应单独的哈希函数h(索引到数组某个位置)和g(哈希函数g的目的是无偏估计),然后取结果的平均值。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/155537.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【卷积神经网络】YOLO 算法原理

在计算机视觉领域中,目标检测(Object Detection)是一个具有挑战性且重要的新兴研究方向。目标检测不仅要预测图片中是否包含待检测的目标,还需要在图片中指出它们的位置。2015 年,Joseph Redmon, Santosh Divvala 等人…

360加固APP后启动崩溃—注意加固前后签名是否一致

如下截图所示,我今天就是遇到了这个问题,这个问题是比较好解决,但如果官网有显眼指引说明会不会对开发者更友好些呢? 首先我们给360的加固包是带有自己的签名的,然后经360加固过后(免费的加固服务&#xf…

Mybatis—XML配置文件、动态SQL

学习完Mybatis的基本操作之后&#xff0c;继续学习Mybatis—XML配置文件、动态SQL。 目录 Mybatis的XML配置文件XML配置文件规范XML配置文件实现MybatisX的使用 Mybatis动态SQL动态SQL-if条件查询 \<if\>与\<where\>更新员工 \<set\>小结 动态SQL-\<forea…

按相同时间切割长视频

需求 将一段1小时的.mkv视频&#xff0c;按每5分钟切割&#xff0c;并转成.mp4 工具 格式工程 x64 5.15&#xff0c;下载 这真是个好工具&#xff0c;考虑过PR&#xff0c;无意间发现这软件很强大 实现步骤 第一步&#xff1a;选择视频&#xff0c;导出MP4&#xff0c;添…

HTML基础

HTML 基础 HTML 结构 HTML 代码是由 “标签” 构成的. <body>hello</body>第一个html 文件 <html> <head></head><body>hello world</body> </html>下面我们看一下这个代码的特点: html 代码是通过标签来组织的, 形如 &l…

Android开发知识学习——HTTPS

文章目录 定义HTTPS连接HTTPS 连接建立的过程课后题 定义 HTTP Secure / HTTP over SSL / HTTP over TLS SSL&#xff1a;Secure Socket Layer -> TLS Transport Layer Security 定义&#xff1a;在HTTP之下增加的一个安全层&#xff0c;用于保障HTTP的加密传输 本质&…

数据查找(search)-----线性表查找

目录 前言 线性表查找 1.无序表查找 2.无序表查找 3.分块查找 前言 前面我们已经学习过了相关数据结构的知识&#xff0c;那么今天我们就开始去学习数据的查找&#xff0c;在不同的数据结构里面去查找目标数据&#xff0c;这就是数据的查找算法。今天就从线性结构的表去查…

【进阶C语言】数组笔试题解析

本节内容以刷题为主&#xff0c;大致目录&#xff1a; 1.一维数组 2.字符数组 3.二维数组 学完后&#xff0c;你将对数组有了更全面的认识 在刷关于数组的题目前&#xff0c;我们先认识一下数组名&#xff1a; 数组名的意义&#xff1a;表示数组首元素的地址 但是有两个例外…

Xposed hook 抖音首页标签隐藏

Xposed hook 抖音首页标签隐藏 本篇文章主要使用xposed hook arraylist,来实现 抖音首页部分标签条目隐藏。 直接上代码&#xff1a; //隐藏首页tab XposedHelpers.findAndHookMethod(ArrayList.class, "add", Object.class, new XC_MethodHook() {Overrideprotect…

HTML标签、CSS介绍

标签的分类: 块级/行内 # 块级标签: 独占一行 h1~h6 p div """ 块儿级标签可以修改长宽. 行内标签不可以, 就算修改了也不会变化.块级标签内部可以嵌套任意的块级标签和行内标签. 特例: 是p标签虽然是块级标签 但是它只能嵌套行内标签 不能嵌套块级标签. 如…

VINS-Mono-VIO初始化 (五:视觉惯性对齐求解)

整体思想就是根据预积分的公式&#xff0c;把已知量和未知量各放到一边&#xff0c;因为前面的数据都是变换到 c 0 c_{0} c0​下的&#xff0c;不是真正意义上和重力对齐的世界坐标&#xff0c;然后位移和速度的预积分中会用到加速度计获取的重力加速度g&#xff0c;但是这个重…

深入理解udp

1.再谈端口号 1.1复习 我们上一篇谈了很久的应用层的http&#xff0c;并在此前我们使用socket编程写了一个能相互通信的客户端与服务端&#xff0c;但是我们也只是粗略的理解了一下tcp和udp在编程过程中所形成的差异性&#xff0c;并没有实质去了解一下其详细内容&#xff0c;…