矩阵奇异值分解

news/2025/3/20 21:10:15/文章来源:https://www.cnblogs.com/mercurystraw/p/18783969

矩阵奇异值分解

奇异值分解(Singular Value Decomposition,SVD)

1. 定义

奇异值分解(Singular Value Decomposition, SVD)是一种将任意实数或复数矩阵分解为三个特定矩阵乘积的数学方法。它在数据降维、信号处理和机器学习等领域有广泛应用。

2. 数学表示

给定一个 $ m \times n $ 的实数矩阵 $ A $,其SVD分解为:

\[A = U \Sigma V^T \]

其中:

  • $ U $ 是 $ m \times m $ 的正交矩阵(列向量称为左奇异向量;正交,$ U^TU = E $)
  • $ \Sigma $ 是 $ m \times n $ 的矩形对角矩阵(非对角线元素为0,对角线元素称为奇异值 $ \sigma_1 \geq \sigma_2 \geq \cdots \geq \sigma_r > 0 $)
  • $ V^T $ 是 $ n \times n $ 的正交矩阵的转置(行向量称为右奇异向量;正交,$ V^TV = E $)
  • 一个矩阵可以理解为进行一系列仿射变换,而仿射变换都可以用旋转和伸缩变换结合表示。
  • 这里的奇异值分解可以理解为U矩阵是对原矩阵进行旋转(对准到坐标轴), \(\Sigma\) 矩阵对应在坐标轴上进行伸缩变换,V矩阵再旋转回去

3. 计算步骤

  1. 计算协方差矩阵:

    • 计算 \(A^T A\)\(A A^T\),分别得到 \(n \times n\)\(m \times m\) 的对称矩阵。
  2. 特征值分解:

    • \(A^T A\) 进行特征分解,得到特征值 \(\lambda_i\) 和特征向量 \(v_i\),构成矩阵 \(V\)
    • \(A A^T\) 进行特征分解,得到特征向量 \(u_i\),构成矩阵 \(U\)
  3. 奇异值提取:

    • 奇异值 \(\sigma_i = \sqrt{\lambda_i}\),按降序排列构成 \(\Sigma\) 的对角线。
  • \[ \Sigma = \begin{bmatrix}\sigma_1 & 0 & \cdots & 0 \\0 & \sigma_2 & \cdots & 0 \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \cdots & \sigma_r \end{bmatrix} \]

  1. 构造矩阵:
    • \(U\)\(V\) 的列向量分别对应左、右奇异向量,满足 \(A v_i = \sigma_i u_i\)

4. 关键性质

  • 降维与低秩近似: (非常重要!!
    通过保留前 \(k\) 个最大的奇异值(截断SVD),可近似原矩阵(或者说将计算出的前 k 项保留)

    \[A \approx U_k \Sigma_k V_k^T \]

    其中 \(U_k\)\(V_k\) 为前 \(k\) 列,\(\Sigma_k\) 为前 \(k\) 个奇异值构成的子矩阵。这种近似在保留主要信息的同时显著降低计算复杂度。

    因为越前面的项保留的主要信息越多,超过一定项数后就可以近似大部分原矩阵效果,同时减去后面的微小的项。

    在图像处理中可以用到,类似于小波分解。

  • 正交性:
    \(U\)\(V\) 的列向量构成正交基,具有旋转的几何意义,而 \(\Sigma\) 表示伸缩。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/902215.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SqlServer 中行转列PIVOT函数用法

SqlServer 中行转列PIVOT函数用法 前言 最近在面试的时候,碰到了手写sql的题目,这让我这个面向AI的程序员着实难看。只见我面露难色,绞尽脑汁的情况下,终于还是放弃了。 这道题目不难,但是由于平时几乎没有遇到行转列的情况,导致在手写时忘记了PIVOT函数怎么使用😩。 面…

第五周第四天

所用时间:180分钟 代码量(行):15 博客量(篇):1 了解到的知识点: 1.matplotlib的配置 因为要参加数学建模大赛,今天配置了python和matplotlib环境,尝试运行了程序,代码如下: import matplotlib.pyplot as plt import numpy as np# 生成数据 x = np.linspace(0, 10, …

Vue3中使用TinyMce编辑器

Vue3中使用TinyMce编辑器 - 知乎 一,安装TinyMce富文本vue npm install @tinymce/tinymce-vue -S npm install tinymce -STinyMce本身是英文编辑器,所以还需要下载中文本地化文件:https://www.tiny.cloud/get-tiny/language-packages/下载完成后放入node_modules下的tinymce…

入门Dify平台:如何根据需求选择与创建最合适的应用

今天我们将继续深入讲解Dify,重点介绍如何创建应用。具体来说,我们将探讨如何根据不同的需求来决定选择什么类型的应用最为合适,帮助大家更好地理解在Dify平台上构建应用的最佳实践。 创建空白应用 首先,我们需要进入Dify的首页选择工作室,并创建空白应用。如图所示:点击…

月暗推出音频模型 AudioX:任意内容生成音频和配乐;开源 TTS 模型 Orpheus,可生成叹息、笑声等非文本线索丨日报

开发者朋友们大家好:这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑…

202110211215 - IT项目管理笔记

IT项目管理中的百慕大 资源 、范围、进度 三角平衡 项目管理 -- 做事 启动、规划、执行、控制、收尾 项目管理 -- 四个层次: 复杂的事情简单化:分解 简单的事情量化:临界值 量化的事情专业化:规律 专业的事情模板化:框架模板 项目: 为创造特定产品或服务的一项有时限的任…

k8s拉取私有镜像的2种方式

k8s 在拉取私有镜像时 ,传递认证信息目录通过secret通过ServiceAccount 通过secret01-image-pull.yamlkind: Pod apiVersion: v1 metadata:name: imagepull-nginxlabels:group: imagepull spec:containers:- name: nginximage: registry.cn-beijing.aliyuncs.com/hkui_dev/ngi…

202110111235 - 软件工程笔记

1. 概述 1.1 开发只占冰山一角 1.2 计算机科学、数学,工程,管理 1.3 软件开发的本质:实现问题域中的概念和处理逻辑 到 运行平台的概念和处理逻辑的映射。系统建模 需求 -> 设计 -> 实现1.4 软件工程的目标:生产具有正确性、可用性、以及开销合宜的产品。 1.5 软件工…

202109060657 - hadoop架构和读写流程

1. 整体架构 hdfs架构zkmonode高可用。HA的工作原理?是否需要每个datanode监听zk?namenodeNameNode(nn):Hdfs集群的管理者,Master 管理Hdfs的名称空间(NameSpace) 维护副本策略 记录文件块(Block)的映射信息 负责处理客户端读写请求datanodeDataNode:NameNode下达命令,…

基于风险的完整性和检查建模(RBIIM)MATLAB仿真

1.程序功能描述 基于风险的完整性和检查建模(Risk-Based Integrity and Inspection Modeling ,RBIIM)MATLAB仿真,对比prior density,posterior perfect inspection,posterior imp inpection,cummulative posterior imperfect inspection四个指标。 2.测试软件版本以及…

202108151156 - kafka消费积压案例

0. 背景 上游厂家生产信令数据,我方消费kafka数据,过滤后插入HBase。 上游生产的信令数据分了4个主题,每个主题有若干分区,这4个主题的数据消费后都插入同一张HBase表。 问题:kafka消息积压达到百亿。 以下以topic1为例,有6个分区。 1. 查看消费滞后情况 kafka-consumer-…

mysql 多表怎么连接的

前言 简单描述一下多表怎么连接的。 正文 首先,我们得抛开我们一些自以为是的想法。 我想过这个问题,就是为什么我们背乘法口诀的时候,我们总是背: 22 = 4, 99=81 这样背下去,似乎这是口诀。然而这是缓存,不是计算,既然不是计算那么就不是逻辑学。 我们理所当然的想9*9…