特征提取(Feature Extraction)常见统计特征笔记(三)

        统计特征是描述数据集中值的一组量,通常用于了解数据的分布、集中趋势和变异程度。常见的统计特征包括均值、中位数、众数、标准差、方差等。下面会详细解释每个统计特征,并给出相应的Python代码。

        1、均值(Mean):所有数据值的平均值。计算公式为:

        

        其中 𝑥𝑖是第 𝑖个数据值,是数据的总数。

def mean(data):return sum(data) / len(data)# Example
data = [1, 2, 3, 4, 5]
print("Mean:", mean(data))

        2、中位数(Median):将数据排序后位于中间位置的值,如果数据个数为奇数,则中位数为中间的值;如果为偶数,则为中间两个数的平均值。

def median(data):sorted_data = sorted(data)n = len(sorted_data)mid = n // 2if n % 2 == 0:return (sorted_data[mid - 1] + sorted_data[mid]) / 2else:return sorted_data[mid]# Example
data = [1, 2, 3, 4, 5]
print("Median:", median(data))

        3、众数(Mode):数据集中出现频率最高的值。一个数据集可能有一个或多个众数。

from collections import Counterdef mode(data):counts = Counter(data)max_count = max(counts.values())mode = [k for k, v in counts.items() if v == max_count]return mode# Example
data = [1, 2, 2, 3, 4, 4, 4, 5]
print("Mode:", mode(data))

        4、标准差(Standard Deviation):衡量数据集合中数据值的分散程度,标准差越大表示数据越分散。公式:

import mathdef standard_deviation(data):m = mean(data)variance = sum((x - m) ** 2 for x in data) / len(data)return math.sqrt(variance)# Example
data = [1, 2, 3, 4, 5]
print("Standard Deviation:", standard_deviation(data))

     5、方差(Variance):标准差的平方,表示数据分散程度的一个度量。

def variance(data):m = mean(data)return sum((x - m) ** 2 for x in data) / len(data)# Example
data = [1, 2, 3, 4, 5]
print("Variance:", variance(data))

        这些是常见的统计特征及其相应的Python实现。在实际应用中,可以根据数据的特点选择合适的统计特征来描述和分析数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/661202.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中兴UME网管LTE共享参数配置-PLMN添加

本文为中兴设备UME网管电联中频共享参数配置,PLMN添加参数配置部分,因UME与U31网管添加PLMN配置区别较大,UME网管需同时配置运营商EN-DC策略,相关配置流程及参数配置如下文。 PLMN eNodeB CU …

前后端数据加密代码实战(vue3.4+springboot 2.7.18)

简述: 文章主要讲述了在vue3与springboot交互数据的个人使用的一个加密形式 SHA256不可逆加密AES对称加密RSA非对称加密 加密算法就不带大家深入了,对于它的使用文章中有明确的案例 数据加密的大概流程为:(有更优秀的方案可以…

OpenCV 实现霍夫圆变换(52)

返回:OpenCV系列文章目录(持续更新中......) 上一篇:OpenCV实现霍夫变换(51) 下一篇:OpenCV 实现重新映射(50) 目标 在本教程中,您将学习如何: 使用 OpenCV 函数 HoughCircles()检测图像中的圆圈。 理论 Hough 圆…

KPlayer搭建指南:开启24小时直播之旅

引言 在这个数字化时代,无人值守直播成为了一种新兴的趋势。无论是企业还是个人,都可以通过无人值守直播来提高效率和观众参与度。本文将介绍如何使用KPlayer在Linux环境下搭建无人值守直播系统。 KPlayer简介 KPlayer是一款基于Linux的媒体服务器工具…

STM32利用硬件I2C读取MPU6050陀螺仪数据

有了前面的基本配置,这节读取MPU6050的数据还算是简单,主要就是初始化时给MPU6050一些配置,取消睡眠模式,MPU6050开机是默认睡眠模式的,读写无效,所以上来就要先更改配置: MPU6050寄存器初始化…

实操——使用uploadify插件(php版和Java版) 与 Dropzone.js插件分别实现附件上传

实操——使用uploadify插件(php版和Java版)与 Dropzone.js插件分别实现附件上传 1. 使用uploadify插件上传1.1 简介1.1.1 简介1.1.2 参考GitHub 1.2 后端PHP版本的uploadify1.2.1 下载项目的目录结构1.2.2 测试看界面效果1.2.3 附页面代码 和 PHP代码 1.…

面试经典算法题之双指针专题

力扣经典面试题之双指针 ( 每天更新, 每天一题 ) 文章目录 力扣经典面试题之双指针 ( 每天更新, 每天一题 )验证回文串收获 392. 判断子序列 验证回文串 思路 一: 筛选 双指针验证 class Solution { public:bool isPalindrome(string s) {// 所有大写字母 > 小写 去除非字母…

Floyd判圈算法

目录 1.概念以及用途 2.具体解决代码以及逻辑推理 (1)判断链表是否有环 (2)判断环的长度 (3)判断环的起始点 3.例题 1.概念以及用途 Floyd判圈算法,又被称之为龟兔赛跑算法(为…

【stomp 实战】Spring websocket 用户订阅和会话的管理源码分析

通过Spring websocket 用户校验和业务会话绑定我们学会了如何将业务会话绑定到spring websocket会话上。通过这一节,我们来分析一下会话和订阅的实现 用户会话的数据结构 SessionInfo 用户会话 用户会话定义如下: private static final class Sessio…

Linux内核深入学习 - 中断与异常(上)

中断与异常 中断通常被定义为一个事件:让事件改变处理器执行的指令顺序这样的事件,与CPU芯片内外部硬件电路产生的电信号相对应! 中断通常分为同步中断与异步中断: 同步中断指的是当指令执行时,由CPU控制单元产生的…

《QT实用小工具·四十九》QT开发的轮播图

1、概述 源码放在文章末尾 该项目实现了界面轮播图的效果,包含如下特点: 左右轮播 鼠标悬浮切换,无需点击 自动定时轮播 自动裁剪和缩放不同尺寸图片 任意添加、插入、删除 单击事件,支持索引和自定义文本 界面美观,圆…

【MyBatis】 MyBatis框架下的高效数据操作:深入理解增删查改(CRUD)

💓 博客主页:从零开始的-CodeNinja之路 ⏩ 收录文章:【MyBatis】 MyBatis框架下的高效数据操作:深入理解增删查改(CRUD) 🎉欢迎大家点赞👍评论📝收藏⭐文章 目录 My …