换元法与线性代数中的二次型

news/2024/11/17 15:31:45/文章来源:https://www.cnblogs.com/szdytom/p/18550608

一个“神来之笔”的换元?

问题:若实数 \(x,y\) 满足 \(x^2+4y^2-2xy=36\),求 \(x^2+3y^2-xy\) 的取值范围。

这个问题比较平凡,使用拉格朗日乘数法可以很机械地解决它。

拉格朗日乘数法

\(f(x,y)=x^2+4y^2-2xy-36,g(x,y)=x^2+3y^2-xy\), 我们要求 \(\nabla g\)\(\{\nabla f\}\) 的张成空间的元素,在二元的情况下,即

\[\nabla f\times \nabla g=0 \]

这样,我们可以省略乘数带来的未知数,联立 \(f=0\),得到:

\[\begin{cases}x^2+4y^2-2xy-36=0\\(2x-2y)(-x+6y)-(-2x+8y)(2x-y)=0\end{cases} \]

这个方程有四组解,分别是

\[\begin{aligned}&\left\{x\to\sqrt {2}\left (\sqrt{3} - 3 \right),y\to\sqrt {6} \right\}, \\&\left\{x\to 2\sqrt {6 - 3\sqrt {3}},y\to - \sqrt {6} \right\}, \\&\left\{x\to - 2\sqrt {3\left (\sqrt {3} + 2 \right)}, y\to - \sqrt {6}\right\}, \\&\left\{x\to 2\sqrt {3\left (\sqrt {3} + 2 \right)}, y\to\sqrt {6} \right\}\end{aligned} \]

分别带入 \(g\) 中,得到最小值和最大值分别为 \(36-6 \sqrt3\)\(36+6\sqrt3\)

但是,可以发现,这个问题使用拉格朗日乘数法涉及到复杂的计算,不借助计算机求解这种非退化的二元二次方程十分痛苦。

我偶然得到了一种更加有趣的做法,它(看似)可以在高中数学的框架下解决这个问题:首先令 \(u=x-y,v=\sqrt3y\),于是

\[x=u+\frac{v}{\sqrt3},y=\frac{v}{\sqrt3} \]

代入 \(x^2+4y^2-2xy=36\),即

\[\left(u+\frac{v}{\sqrt3}\right)^2+\left(\frac{v}{\sqrt3}\right)^2-2\left(u+\frac{v}{\sqrt3}\right)\left(\frac{v}{\sqrt3}\right)=36 \]

化简得到 \(u^2+v^2=36\),于是进一步换元,则

\[u=6\cos\theta,v=6\sin\theta \]

代回所求 \(x^2+3y^2-xy\),得到 \(u^2+v^2+\frac1{\sqrt3}uv\),进一步可得 \(36+12\sqrt3\sin\theta\cos\theta\),考虑到 \(\sin2\theta=2\sin\theta\cos\theta\),故最终可得,所求式子由

\[36+6\sqrt3\sin2\theta \]

给出。显然这个式子的取值范围为 \([36-6\sqrt3,36+6\sqrt3]\)

这个做法中大部分都是十分平凡的,最后的化简看似取巧,其实即使不能简单化为单个 \(\sin2\theta\),也可以对式子关于 \(\theta\) 求导来分析其最值。这个做法最引人注意的是开头那看似“神来之笔”的换元“令 \(u=x-y,v=\sqrt3y\)”,这是如何得到的?

二次型

上面做法的第一次换元的目的,是将 \(xy\) 项消除,并留下系数相同的 \(x^2\) 项和 \(y^2\) 项,以方便进一步换元。

其中的奥妙在于,从几何上来看,原式 \(x^2+4y^2-2xy=36\) 可以看做一个椭圆,而换元的过程,就是将这个椭圆在一个线性变换后,变为一个正圆 \(x^2+y^2=36\)

我们使用二次型来刻画这一点,记向量 \(\mathbf{v}=[x\quad y]\)(注意粗体的字母表示向量,和上文的斜体表示的值不一样),则

\[\mathbf{v}^{\mathsf{T}}A\mathbf{v}=ax^2+2bxy+cy^2 \]

其中矩阵 \(A\)

\[A=\left[\begin{matrix} a & b\\ b & c \end{matrix}\right]\]

那么,所谓换元,就是记向量 \(\mathbf{u}=[u\quad v]\),满足 \(\mathbf{u}=P\mathbf{v}\),其中可逆矩阵 \(P\) 就是换元的系数。于是

\[\begin{aligned}\mathbf{v}^{\mathsf{T}}A\mathbf{v}&=(P^{-1}\mathbf{u})^{\mathsf{T}}A(P^{-1}\mathbf{u})\\&=\mathbf{u}^{\mathsf{T}}\left(P^{-1}\right)^{\mathsf{T}}AP^{-1}\mathbf{u}\\&=\mathbf{u}^{\mathsf{T}}B\mathbf{u}\end{aligned} \]

其中矩阵 \(B=\left(P^{-1}\right)^{\mathsf{T}}AP^{-1}\)。我们希望换元后变成正圆,相当于要求 \(B\) 为单位矩阵的倍数,不妨认为 \(B=\mathrm{I}\)(对于是 \(\mathrm{I}\)\(k\) 倍数的情况,只需将换元矩阵除以 \(\sqrt{k}\) 即可),于是相当于有

\[P^{\mathsf{T}}P=A \]

只需求出一个满足条件的 \(P\) 即可,在上面的例子中,有

\[\begin{aligned}A&=\left[\begin{matrix} 1 & -1\\ -1 & 4 \end{matrix}\right]\\ P&=\left[\begin{matrix} 1 & -1\\ 0 & \sqrt3 \end{matrix}\right] \end{aligned}\]

可以发现,确实有

\[P^{\mathsf{T}}P=\left[\begin{matrix} 1 & 0\\ -1 & \sqrt3 \end{matrix}\right]\left[\begin{matrix} 1 & -1\\ 0 & \sqrt3 \end{matrix}\right]=\left[\begin{matrix} 1 & -1\\ -1 & 4 \end{matrix}\right]=A\]

对称矩阵分解与普定理

我们现在把问题转化为了,对于给定的对称矩阵 \(A\), 我们希望找到一个矩阵 $ P $,使得

\[PP^{\mathsf{T}} = A \]

注:考虑到对称性,\(PP^{\mathsf{T}}\)\(P^{\mathsf{T}}P\) 是一样的,这里采取前一种是为了与大多数线性代数书中的习惯做法保持一致。

首先,我们将矩阵 \(A\) 进行特征值分解:由于 \(A\) 是对称矩阵,我们可以利用对称矩阵的特征值分解:

\[A = Q \Lambda Q^{-1} \]

其中:

  • \(Q\) 是一个正交矩阵(即 \(Q^T Q = \mathrm{I}\)),它的列是 \(A\) 的单位特征向量。
  • \(\Lambda\) 是一个对角矩阵,包含了 \(A\) 的特征值。

由于 \(Q^T Q = \mathrm{I}\),上式也即

\[A = Q \Lambda Q^{\mathsf{T}} \]

我们所求的矩阵 \(P\) 即满足

\[P P^{\mathsf{T}} = Q \Lambda Q^{\mathsf{T}} \]

我们可以考虑 \(P\) 的形式为

\[P = Q \sqrt{\Lambda} \]

其中 \(\sqrt{\Lambda}\) 是通过对角矩阵 \(\Lambda\) 的每个对角元素取平方根得到的矩阵。

TODO:特征值为负数该怎么办?这可能吗?

现在,我们可以验证 \(P = Q \sqrt{\Lambda}\) 满足 \(P P^{\mathsf{T}} = A\)

\[P P^{\mathsf{T}} = (Q \sqrt{\Lambda})(Q \sqrt{\Lambda})^{\mathsf{T}} = Q \sqrt{\Lambda} \sqrt{\Lambda} Q^{\mathsf{T}} = Q \Lambda Q^{\mathsf{T}} = A \]

用 Mathematica 的话说,就是:

a = {{1, -1}, {-1, 4}};
q = Transpose[Normalize /@ Eigenvectors[a]];
lam = DiagonalMatrix[Sqrt[Eigenvalues[a]]];
p = q . d;(* 验证 *)
Simplify[p . Transpose[p] == a]

待定系数法

上面方法构造的矩阵 \(P\) 并非前文中所使用的矩阵 \(P\),而是一个十分复杂的结果:

\[P=\left[ \begin{matrix}-\frac{1}{2} \sqrt{2+\frac{7}{\sqrt{13}}} \left(\sqrt{13}-3\right) & \frac{1}{2} \sqrt{2-\frac{7}{\sqrt{13}}} \left(\sqrt{13}+3\right) \\\sqrt{2+\frac{7}{\sqrt{13}}} & \sqrt{2-\frac{7}{\sqrt{13}}} \\ \end{matrix} \right]\]

这是一个正确,但过于复杂的构造,事实上,我们也可以简单使用待定系数法来构造矩阵 \(P\),设\(P=[k_1\quad k_2;k_3\quad k_4]\),则 \(PP^{\mathsf{T}} = A\) 相当于

\[\begin{cases} k_1^2+k_2^2=a\\ k_1k_3+k_2k_4=b\\ k_3^2+k_4^2=c \end{cases}\]

四个未知数三个方程,可以任取其中一个未知数的值(注意不要使 \(P\) 不可逆),求解剩下三个,这其实并不困难。

齐次化

对于更一般的,形如 \(ax^2+2bxy+cy^2+2dx+2ey+f=0\) 的式子,我们可以通过齐次化来将其转为二次型,即令 \(\mathbf{v}=[x\quad y\quad 1]\),则

\[\mathbf{v}^{\mathsf{T}}A\mathbf{v}=0 \]

其中矩阵 \(A\)

\[A=\left[\begin{matrix} a & b & d\\ b & c & e\\ d & e & f \end{matrix}\right]\]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/835362.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【学习篇】patran设置阻尼

在数学和力学甚至机械专业中,质量-弹簧-阻尼系统是基础、经典的模型。其数学模型表示为: $$ m\ddot{x} +c\dot{x} +kx = 0 \qquad(1) $$ 有限元模型比较简单,就是两个质量点+弹簧假设上述式子的初值为 $$ \begin{cases} u(0)=0.2 \ \dot{u}(0)=0 \end{cases} $$ 各项系数为变…

mysql 查询每个订单总价和购买商品的总类数

数据表 CREATE TABLE goods ( order_id INT NOT NULL, goods_id INT NOT NULL, price DECIMAL(10, 2) NOT NULL ); 插入数据 INSERT INTO goods (order_id, goods_id, price) VALUES (1, 1, 3.5), (1, 2, 4.0), (2, 4, 6.0); 数据查询 SELECT order_id, SUM(price) AS total_pr…

【视频讲解】Python深度神经网络DNNs-K-Means(K-均值)聚类方法在MNIST等数据可视化对比分析

全文链接:https://tecdat.cn/?p=38289 原文出处:拓端数据部落公众号 分析师:Cucu Sun 近年来,由于诸如自动编码器等深度神经网络(DNN)的高表示能力,深度聚类方法发展迅速。其核心思想是表示学习和聚类可以相互促进:好的表示会带来好的聚类效果,而好的聚类为表示学习提…

时间

JDK7 时间 全世界的时间, 有一个统一的计算标准. 格林尼治时间/格林威治时间 (Greenwich Mean Time) 简称 GMT. 计算核心: 地球自转一天是 24 小时, 太阳直射时为正午 12 点. 后来发现计算误差较大, 现在格林威治时间已经不再作为标准时间来使用了. 到了 2012 年 1 月, 取消了用…

贴代码框架PasteForm特性介绍之markdown和richtext

简介 PasteForm是贴代码推出的 “新一代CRUD” ,基于ABPvNext,目的是通过对Dto的特性的标注,从而实现管理端的统一UI,借助于配套的PasteBuilder代码生成器,你可以快速的为自己的项目构建后台管理端!目前管理端只有Html+js版本的,后续将支持小程序,Vue等 案例源码 案例源…

MATLAB用CNN-LSTM神经网络的语音情感分类深度学习研究

全文链接:https://tecdat.cn/?p=38258 原文出处:拓端数据部落公众号 在语音处理领域,对语音情感的分类是一个重要的研究方向。本文将介绍如何通过结合二维卷积神经网络(2 - D CNN)和长短期记忆网络(LSTM)构建一个用于语音分类任务的网络,特别是针对语音情感识别这一应…

2024长城靶场训练

仿射密码 首先题目描述 使用仿射函数y=3x+9加密得到的密文为JYYHWVPIDCOZ,请尝试对其解密。flag为flag{大写明文}。 1、使用在线网站直接破解或手工计算破解,获得flag。(参数a=3,b=9,对应仿射函数y=3x+9) 仿射密码加密_仿射密码解密手工计算使用解密函数为D(x) = a^-1(x …

学期2024-2025-1 学号20241421 《计算机基础与程序设计》第8周学习总结

作业信息 |这个作业属于哪个课程|https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP| |这个作业要求在哪里|https://www.cnblogs.com/rocedu/p/9577842.html#WEEK08| |这个作业的目标|功能设计与面向对象设计,面向对象设计过程,面向对象语言三要素,汇编、编译、解释、…

QObject,QMainWindpw,QWidget,QDialog介绍

QObject QObject 的角色和特点 在 Qt 框架中,QObject 是整个对象模型的核心基类,它为 Qt 对象树 和 信号-槽机制 提供了基础支持。很多 Qt 的类(包括 QWidget、QDialog、QMainWindow)都直接或间接继承自 QObject。 QObject 的核心功能对象树管理(Object Tree)QObject 提供…

2024-2025-1 20241329 《计算机基础与程序设计》第八周学习总结

作业信息 作业归属课程:https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP 作业要求:https://www.cnblogs.com/rocedu/p/9577842.html#WEEK08 作业目标:功能设计与面向对象设计;面向对象设计过程;面向对象语言三要素;汇编、编译、解释、执行 作业正文:https://www…

Alpha冲刺(4/14)——2024.11.15

目录一、团队成员分工与进度二、成员任务问题及处理方式三、冲刺会议内容记录会议内容四、GitHub签入记录及项目运行截图GitHub签入记录五、项目开发进展及燃尽图项目开发进展燃尽图六、团队成员贡献表 一、团队成员分工与进度成员 完成的任务 完成的任务时长 剩余时间施靖杰 完…

高三鲜花 #2

水发现放假之后其实连鲜花都是不想写的了。 所以这是钓鱼博。 也不能钓这么直接,还是需要写一点东西的。 应该是马上就距离高考还剩 200 天了。然后这里本来写了很多关于 whk 的文本,全删了,觉得有点无意义,毕竟这应该是一篇钓鱼博。 whk 真难。 突然发现我已经退役四个月了…