抽样算法——【数据科学与工程算法基础】

一、前言

        这是课程的第二章节——抽样算法,主要分为三类。


详情可参考: 数据科学的算法基础——学习记录跳转中心


二、正篇 

        1.系统抽样 

        课本只介绍了最简单的——等距抽样。 

         直线等距抽样(N=n*k):即总体个数可以被抽样个数整除时,每隔k个取一个样本,第一个可能给出,可能随机。        

        圆形等距抽样(N!=n*k):依旧,只不过成了圆,超出范围了接着从头取

        2.分层抽样 

        高中知识,按比例分层,之后按照简单随机或系统抽样在每一层抽取相应个数。 

        3. 水库抽样

         总体容量未知,数据流无限,以例子讲解如何做,不再证明,感兴趣自行搜索。

 简述给定一个数据流,如何均匀地从中随机抽取1000条记录?

三、例题 

         1.直线等距

        用系统抽样法从160个灯泡中抽取一个容量为20的样本。将这160个灯泡编号为1~160,若第16个被抽中的个体编号为126,则起始编号为(    6    )

         2.圆形等距

        设总体有14个个体,按照1~14进行编号。欲以系统抽样法抽取容量为n=4的样本,且第一个抽中的样本编号为4,则最后一个样本编号为(    2    )

四、总结 

         三种方法共同点:抽样时每个个体被抽取到的可能性相等,但各有特点。

     ————跳转下一章节:抽样算法 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/541020.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【刷题训练】LeetCode125. 验证回文串

验证回文串 题目要求 示例 1: 输入: s “A man, a plan, a canal: Panama” 输出:true 解释:“amanaplanacanalpanama” 是回文串。 示例 2: 输入:s “race a car” 输出:false 解释:“rac…

Docker-数据卷、网络、dockerfile、挂载

目录 一、数据卷 二、MySQL数据 三、具名和匿名挂载 1、匿名挂载 2、具名挂载 3、指定挂载 四、Dockerfile 1、数据卷容器 2、dockerfile构建步骤 五、数据卷容器 1、实现多个容器之间数据共享 2、多个mysql之间共享数据库 六、Docker网络 1、Docker0 1、查看容器…

bpmn-js系列之Palette

前边写了四篇文章介绍了bpmn.js的基本使用,最近陆续有小伙伴加我催更,感谢对我这个半吊子前端的信任,接着更新bpmn.js的一些高级用法,本篇介绍对左侧工具栏Palette的隐藏和自定义修改 隐藏shape 左侧工具栏Palette有些图标我用不…

MATLAB:一些杂例

a 2; b 5; x 0:pi/40:pi/2; %增量为pi/40 y b*exp(-a*x).*sin(b*x).*(0.012*x.^4-0.15*x.^30.075*x.^22.5*x); %点乘的意义 z y.^2; %点乘的意义 w(:,1) x; %组成w,第一列为x w(:,2) y; %组成w,第二列为y w(:,3) z; %组成w,第三列为z…

MySQL一些命令记录

查看数据引擎 show engines;创建数据库,并选择库 CREATE DATABASE IF NOT EXISTS test_database; USE test_database;创建表 CREATE TABLE IF NOT EXISTS test_table (id INT AUTO_INCREMENT PRIMARY KEY,field1 VARCHAR(50),field2 VARCHAR(50),field3 VARCHAR(50),field4 …

2024最新注册谷歌账号(Gmail邮箱),解决此号码无法用于验证的方法,亲测有用!

我们知道,拥有一个谷歌账号/Gmail邮箱注册在全球互联网冲浪时会比较方便。但不少人在注册过程中,遇到了“此号码无法用于验证”的问题,如图: 有些人可能会认为是因为国内的手机号才没办法用于验证的,这简直是在胡说&am…

续上篇 qiankun 微前端配置

上篇文章地址:微前端框架 qiankun 配置使用【基于 vue/react脚手架创建项目 】-CSDN博客 主应用: src/main.js 配置: import Vue from vue import App from ./App.vue import router from ./router import { registerMicroApps, start } …

云计算与APP开发,如何利用云端服务提升应用性能?

随着移动应用程序(APP)的普及,如何提升应用性能成为了开发者们关注的重点之一。而云计算技术的发展为APP开发者提供了全新的解决方案。本文将探讨云计算与APP开发的结合,以及我们公司提出的解决方案,帮助开发者利用云端…

使用阿里云服务器查看网站备案的方法和注意事项

随着互联网的发展,网站注册已成为在中国建设网站的必要步骤。 在使用阿里云服务器时,我们可以通过以下步骤查看网站注册状态。 备案概述: 在中国,互联网信息服务提供者必须进行登记,以监管互联网内容、规范市场运营和…

3.14号arm

1. 计算机基础理论 1.1 计算机的组成 输入设备:将数据转换成计算机可以识别,存储,处理的形式,发送到计算机中 输出设备:将计算机对程序和数据的运算结果输送到外部的设备 存储器:用于将数据保存的模块。 …

phy接口不用网络变压器

phy接口不用网络变压器 Hqst华强盛导读:网络变压器的作用原理是基于电磁感应的原理。当电流通过一个线圈时,会产生一个磁场。如果将另一个线圈放置在这个磁场中,磁场就会穿过另一个线圈,从而在另一个线圈中产生电流。这个过程被称…

识别和定位 - 实现工业自动化及生产数字化,推动现代工业4.0

工业4.0的定义 工业 4.0 是指将智能数字化技术集成到制造和工业流程,包括工业物联网网络、人工智能、大数据、机器人和自动化等一系列技术。工业 4.0 能帮助企业实现智能制造,建立智能工厂,目标是提高生产力、效率和灵活性,同时在…