统计学-认识数据

数据

如:
定性数据:
性别:男、女
颜色:红、绿、青、蓝、紫
教育程度:高中、本科、硕士、博士
评价:好评、中评、差评

定量数据:
年份:2019、2018、2017、2016
温度:10、15、20、25、30、35、40
身高:160、165、170、175、180
体重:40、45、50、55、60、65

数据和变量

  • 数据(data)是由变量(variable)组成的

性别 颜色 教育程度 评价
年份 温度 身高 体重

  • 一个变量(variable)应该包含至少2个不同的取值

定性 /分类变量

性别:男(1)、女(2)
颜色:红(1)、绿(2)、青(3)、蓝(4)、紫(5)
类别;性质上的差异,而非数量上的差异
只能进行是否相等的比较
无顺序(不能比较大小)或等级(不能比较优劣)

教育程度:高中(3)、本科(4)、硕士(5)、博士(6)
评价:好评(5)、中评(3)、差评(1)
类别;性质上的差异,而非数量上的差异
可以进行是否相等的比较
有顺序(可以比较大小)或等级(可以比较优劣)
好评不等于5倍的差评

定量/数值变量

年份:2019、2018、2017、2016
温度:10、15、20、25、30、35、40
数值
可以进行是否相等的比较
有顺序(可以比较大小)
等间距,可以进行加减运算

身高:160、165、170、175、180
体重:40、45、50、55、60、65
数值
可以进行是否相等的比较
有顺序(可以比较大小)
等间距,可以进行加减运算
可以进行乘除运算

观测、变量、与数据矩阵

性别教育程度出生年份身高
高中1999165
本科2000175
硕士2001170
博士1995166

一行叫作 一次观测(observation)
一列叫作 一个变量(variable)
这个表格叫作 数据矩阵(data matrix)

测量尺度

抽象数字系统的属性

四个属性

  • 每一个数字有其独特的含义(identity) 性别 颜色
  • 数字具有从小到大的固有顺序(magnitude)教育程序 评价
  • 任意位置的单位间距是相同的(equal intervals)年份 温度
  • 零(0)表示被测量的属性不存在(absolute/true zero)身高 体重

测量(measurement)

  • 测量是指根据一定的规则,把数字(numbers)分配给观测(observations)
  • 把数字分配给观测的方式,决定了测量尺度(scale of measurement)
  • 每个测量尺度代表抽象数字系统的特定属性或属性集合

名目尺度(nominal scale)

  • 名目尺度是根据事物的特征对其进行分类的一种尺度

只具备第一个属性,即每一个数字有其独特的含义
得到的变量称为: 名目变量(nominal variable) 性别 颜色

次序尺度(ordinal scale)

  • 次序尺度是根据事物的特征对其进行等级排序的一种尺度

具备前两个属性 :
每一个数字有其独特的含义
数字具有从小到大的固有顺序
得到的变量称为: 次序变量(ordinal variable) 教育程度 评价

等距尺度(interval scale)

  • 等距尺度是指数值之间的单位间隔是等距的一种尺度

具备前三个属性:
每一个数字有其独特的含义
数字具有从小到大的固有顺序
任意位置的单位间距是相同的
得到的变量称为: 等距变量(interval variable)年份 温度 时间

等比尺度(ratio scale)

  • 等比尺度是具有等距尺度的所有特性并且零点有意义的尺度

具备所有四个属性:
每一个数字有其独特的含义
数字具有从小到大的固有顺序
任意位置的单位间距是相同的
零(0)表示被测量的属性不存在
得到的变量称为:等比变量(ratio variable) 身高 体重
因为有真零点,因此可以进行乘除运算
没有真零点,则乘除运算结果不唯一(无意义)

测量尺度的重要性

测量尺度决定了可以进行哪些逻辑与数学运算和使用哪种统计方法

尺度举例逻辑与数学运算类别
名目性别、颜色等于、不等于定性/(无序)分类变量
次序教育程度、评价等于、不等于、大于、小于定性/(有序)分类变量
等距温度、年份、时间等于、不等于、大于、小于、加、减定量/数值变量
等比身高、体重、年龄等于、不等于、大于、小于、加、减、乘、除定量/数值变量

image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/438374.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

专业133总分400+上海交通大学819考研经验分享上交819电子信息与通信工程

今年专业819信号系统与信号处理133,总分400,如愿考上梦中上海交通大学,通过自己将近一年的复习,实现了人生中目前为止最大的逆袭(自己本科学校很普通),总结自己的复习经历,希望可以给…

C++ 数论相关题目 扩展欧几里得算法(裴蜀定理)

给定 n 对正整数 ai,bi ,对于每对数,求出一组 xi,yi ,使其满足 aixibiyigcd(ai,bi) 。 输入格式 第一行包含整数 n 。 接下来 n 行,每行包含两个整数 ai,bi 。 输出格式 输出共 n 行,对于每组 ai,bi ,求…

多只动物3D姿态估计与行为识别系统

动物社会行为的量化是动物科学研究的重要步骤。虽然现有的深度学习方法已经实现了对常见动物的精确姿态估计、识别和行为分类,但由于缺乏注释良好的数据集,其应用依然受到挑战。因此该研究展示了一个计算框架,即社会行为图谱(SBeA…

MkDocs 部署指南

简介 MkDocs 可以同时编译多个 markdown 文件,形成书籍一样的文件。有多种主题供你选择,很适合项目使用。 MkDocs 是快速,简单和华丽的静态网站生成器,可以构建项目文档。文档源文件在 Markdown 编写,使用单个 YAML …

大数据StarRocks(八):资源隔离实战

前言 自 2.2 版本起,StarRocks 支持资源组管理,集群可以通过设置资源组(Resource Group)的方式限制查询对资源的消耗,实现多租户之间的资源隔离与合理利用。在 2.3 版本中,StarRocks 支持限制大查询&#…

qt5-入门

参考: qt学习指南 Qt5和Qt6的区别-CSDN博客 Qt 学习之路_w3cschool Qt教程,Qt5编程入门教程(非常详细) 本地环境: win10专业版,64位 技术选择 Qt5力推QML界面编程。QML类似HTML,可以借助CSS进…

LabVIEW机械臂轨迹跟踪控制

介绍了一个使用LabVIEW开发的机械臂轨迹跟踪控制系统。该系统的主要目标是实现对机械臂运动轨迹的精确控制,使其能够按照预定路径进行精确移动。此系统特别适用于需要高精度位置控制的场合,如自动化装配、精密操作等。 为了实现LabVIEW环境下的机械臂轨迹…

React 组件生命周期-概述、生命周期钩子函数 - 挂载时、生命周期钩子函数 - 更新时、生命周期钩子函数 - 卸载时

React 组件生命周期-概述 学习目标: 能够说出组件的生命周期一共几个阶段 组件的生命周期是指组件从被创建到挂在到页面中运行,在到组件不用时卸载组件 注意:只有类组件才有生命周期,函数组件没有生命周期(类组件需要实例化&…

2024最新版IntelliJ IDEA安装使用指南

2024最新版IntelliJ IDEA安装使用指南 Installation and Usage Guide to the Latest JetBrains IntelliJ IDEA Community Editionn in 2024 By JacksonML JetBrains公司开发的IntelliJ IDEA一经问世,就受到全球Java/Kotlin开发者的热捧。这款集成开发环境&#xf…

C#,数据检索算法之插值搜索(Interpolation Search)的源代码

数据检索算法是指从数据集合(数组、表、哈希表等)中检索指定的数据项。 数据检索算法是所有算法的基础算法之一。 本文提供插值搜索(Interpolation Search)的源代码。 1 文本格式 using System; namespace Legalsoft.Truffer.…

Linux实验记录:使用LVM(逻辑卷管理器)

前言: 本文是一篇关于Linux系统初学者的实验记录。 参考书籍:《Linux就该这么学》 实验环境: VmwareWorkStation 17——虚拟机软件 RedHatEnterpriseLinux[RHEL]8——红帽操作系统 备注: 硬盘分好区或者部署为RAID磁盘阵列…

Java多线程--同步机制解决线程安全问题方式一:同步代码块

文章目录 一、介绍二、原理三、同步锁机制(1)synchronized的锁是什么(2)同步操作的思考顺序(3)代码演示 四、同步代码块(1)同步代码块--案例11、案例12、分析同步原理3、案例1之this…