凸优化、拉格朗日乘子、伪正规与Farkas引理

news/2025/3/12 17:33:02/文章来源:https://www.cnblogs.com/eien/p/18768080

优化问题

优化问题的基本形式为:求最小值\(f(x)\),约束条件为\(x\in C\)。其中约束集\(C\)由等式约束、不等式约束以及一个额外的抽象集合约束\(X\)组成,即:

\[C = X\cap\{x|h_1(x)=0,\cdots,h_m(x)=0\}\cap\{x|g_1(x)\leq0,\cdots,g_r(x)\leq0\} \]

伪正规解

伪正规解定义

优化问题的一个可行向量\(x^{*}\)是伪正规的,如果找不到标量\(\lambda_1,\cdots,\lambda_m\)\(\mu_1,\cdots,\mu_r\)以及一个序列\(\{x^{k}\}\subset X\)使得:

  • \[(\sum_{i = 1}^{m}\lambda_{i}\nabla h_{i}(x^{*})+\sum_{j = 1}^{r}\mu_{j}\nabla g_{j}(x^{*}))\in N_{x}(x^{*})(负梯度组合“越界”,在法锥方向内)(1) \]

  • \(\mu_{j}\geq0\)对于所有\(j = 1,\cdots,r\),并且\(\mu_{j}=0\)对于所有\(j\notin A(x^{*})\),其中\(A(x^{*}) = \{j|g_{j}(x^{*})\}\)(乘子规范,其中\(A(x)\)为活动约束);\((2)\)
  • \(\{x^{k}\}\)收敛到\(x^{*}\)并且\(\sum_{i = 1}^{m}\lambda_{i}h_{i}(x^{k})+\sum_{j = 1}^{r}\mu_{j}g_{j}(x^{k})>0\),对\(\forall k\)(破坏了约束的可行性)。\((3)\)

其中第二点的不等式约束分析:

  • \(g(x)<0\)时,约束\(g(x)\leq0\)不起作用,可直接通过条件\(\nabla f(x)=0\)来获得最优点,等价于将\(\lambda\)置零然后对\(\nabla_{x}L(x,\lambda)\)置零得到最优点。
  • \(g(x)=0\)时,类似于等式约束的拉格朗日乘子法中等式约束的分析,即存在常数\(\lambda>0\)使得\(\nabla f(x^{*})+\lambda\nabla g(x^{*})=0\)

特殊情况

\(X=\mathbb{R}^{n}\)且无不等式约束时,\(x^{*}\)是伪正则的当且仅当以下两个条件之一成立:

  • 梯度\(\nabla h_{i}(x^{*})\),其中\(i = 1,\cdots,m\),是线性无关的。
  • 对于每一个非零的\(\lambda=(\lambda_1,\cdots,\lambda_m)\),若满足\(\sum_{i = 1}^{m}\lambda_{i}\nabla h_{i}(x^{*})=0\),那么过原点且法向量为\(\lambda\)的超平面包含在以\(x^{*}\)为球心的某个球内的所有\(x\)对应的向量\(h(x)\)

优化问题的一些约束条件:constraint qualifications(CQ)

CQ1

\(X=\mathbb{R}^{n}\),且\(x^{*}\)满足线性无关约束规格(LICQ),即等式约束梯度\(\nabla h_{i}(x^{*})\)\(i = 1,\cdots,m\))以及起作用的不等式约束梯度\(\nabla g_{j}(x^{*})\)\(j\in A(x^{*})\))线性无关。

CQ2

\(X=\mathbb{R}^{n}\),等式约束梯度\(\nabla h_{i}(x^{*})\)\(i = 1,\cdots,m\))线性无关,并且存在一个\(y\in\mathbb{R}^{n}\),使得$$\nabla h_{i}(x{*})y = 0\(,\)i = 1,\cdots,m\(,\)\nabla g_{j}(x{*})y<0,\forall j\in A(x^{*})$$。

CQ3

\(X=\mathbb{R}^{n}\),函数\(h_{i}\)\(i = 1,\cdots,m\))是仿射函数,函数\(g_{j}\)\(j = 1,\cdots,r\))是凹函数。

CQ4

\(X=\mathbb{R}^{n}\),对于某个整数\(\bar{r}<r\),约束集\(C\)的如下超集\(\bar{C}=\{x|h_{i}(x)=0,i = 1,\cdots,m,g_{j}(x)\leq0,j=\bar{r}+1,\cdots,r\}\)\(x^{*}\)处是伪正规的。此外,存在一个\(y\in\mathbb{R}^{n}\),使得

\[\begin{cases}\nabla h_{i}(x^{*})^{T}y = 0, & i = 1,\cdots,m\\\nabla g_{j}(x^{*})^{T}y\leq0, & \forall j\in A(x^{*})\\\nabla g_{j}(x^{*})^{T}y<0, & \forall j\in\{1,\cdots,\bar{r}\}\cap A(x^{*})\end{cases} \]

CQ5

指标大于某个\(\bar{m}\leq m\)的等式约束:\(h_{i}(x)=0\)\(i=\bar{m}+1,\cdots,m\)是线性的。
不存在向量\(\lambda=(\lambda_1,\cdots,\lambda_m)\),使得\(-\sum_{i = 1}^{m}\lambda_{i}\nabla h_{i}(x^{*})\in N_{X}(x^{*})\)并且标量\(\lambda_1,\cdots,\lambda_{\bar{m}}\)中至少有一个不为零。
子空间\(V_{L}(x^{*})=\{y|\nabla h_{i}(x^{*})^{T}y = 0,i=\bar{m}+1,\cdots,m\}\)\(N_{X}(x^{*})^{*}\)的内部有非空交集,或者,在\(X\)为凸集的情况下,与\(N_{X}(x^{*})^{*}\)的相对内部有非空交集。
存在\(y\in N_{X}(x^{*})^{*}\),使得\(\nabla h_{i}(x^{*})^{T}y = 0\)\(i = 1,\cdots,m\)\(\nabla g_{j}(x^{*})^{T}y<0\)\(\forall j\in A(x^{*})\)

CQ6

\(W=\{(\lambda,\mu)|\lambda_1,\cdots,\lambda_m,\mu_1,\cdots,\mu_r\}\)满足伪正规性定义中的条件(i)和(ii)仅由原点\((0,0)\)组成。

一个重要的命题

对于优化问题,若其可行点\(x^*\)满足约束规格CQ1 - CQ6中的任意一个,则\(x^*\)是拟正则的。

证明思路: 不考虑CQ2,因为它是CQ5的特例。同样明显的是,CQ6意味着伪正规。

依次给出关于CQ1、CQ3、CQ4和CQ5这些情况的结果。在所有情况中,证明方法都是反证法。也就是说,我们假设存在标量\(\lambda_1, \ldots, \lambda_m\)以及\(\mu_1, \ldots, \mu_r\),它们满足拟正规性定义中的条件(i)-(iii)。然后,我们再假设约束规格CQ1、CQ3、CQ4和CQ5中的每一个依次也都满足,并且在每种情况下我们都会得出矛盾。

CQ1的证明方式:

因为\(X = \mathbb{R}^n\),这意味着\(N_X(x^*)=\{0\}\)。并且根据条件(ii),对于所有
\(j \notin A(x^*)\),有\(\mu_j = 0\)。于是我们可以将条件(i)写成:

\(\sum_{i = 1}^{m} \lambda_i \nabla h_i(x^*) + \sum_{j \in A(x^*)} \mu_j \nabla g_j(x^*) = 0.\)

由于\(\nabla h_i(x^*) (i = 1,\ldots,m)\)\(\nabla g_j(x^*) (j \in A(x^*))\)的线性无关性,这意味着对
所有的\(i\)\(\lambda_i = 0\),且对所有\(j \in A(x^*)\)\(\mu_j = 0\)。这一结果,再结合对所有
\(j \notin A(x^*)\)\(\mu_j = 0\)的条件,与条件(iii)矛盾。

Farkas引理

定义

\(A\in R^{m\times n},b\in R^{m}\),那么以下两个论断有且只有一个成立:

  1. 存在\(x\in R^{n}\))\(,使得\)Ax = b\(,且\)x\geq 0$。
  2. 存在\(y\in R^{m}\),使得\(A^{T}y\geq 0\),且(b^{T}y < 0)。

理解

几何解释:对于向量\(b\in R^{m}\),只可能存在两种互斥情况:(1) (b)在这个凸锥里。(2)(b)在这个凸锥外。

如果情况(1)成立,说明(b)属于\(\{a_{1},\cdots,a_{n}\}\)的conic hull,所以肯定能够找到一组非负的\(x_{1} ,\cdots,x_{n}\)使得\(b = x_{1}a_{1}+x_{2}a_{2}+\cdots+x_{n}a_{n}=Ax\)。这也就是定理中的情况(1)。

反之如果情况(2)成立,b在凸锥外面,能够找到一个过原点的超平面,使得b在一边,凸锥在另外一边。这个超平面法向量为\(y\in R^{m}\),因为\(\{a_{1},\cdots,a_{n}\}\)都在凸锥里面,所以

\[\begin{bmatrix} y^{T}a_{1}\\ y^{T}a_{2}\\ \vdots\\ y^{T}a_{n} \end{bmatrix}\geq 0\]

合并写成矩阵乘向量形式就是\(A^{T}y\geq 0\)。且此时\(b^{T}y = y^{T}b < 0\)

增强Farkas引理

定理

\(a_1, \ldots, a_r\)\(c\)\(\mathbb{R}^n\) 中的已知向量,并且假设 \(c \neq 0\)。我们有

对于所有满足 \(a_j^T y \leq 0\), \(\forall j = 1, \ldots, r\)\(y\),有 \(c^T y \leq 0\)

当且仅当存在非负组合 \(\mu_1, \ldots, \mu_r\) 以及一个向量 \(\bar{y} \in \mathbb{R}^n\) 使得

\[c = \mu_1 a_1 + \cdots + \mu_r a_r, \]

\(c^T \bar{y} > 0\),对于所有 \(\mu_j > 0\)\(j\)\(a_j^T \bar{y} > 0\),并且对于所有 \(\mu_j = 0\)\(j\)\(a_j^T \bar{y} \leq 0\)

理解

其中 \(y\)\(a_i\) 各自形成了一个凸锥,增强Farkas引理体现了原问题和对偶问题之间的关系。

表明在 \(a_i\) 凸锥内存在一个方向(由 \(\bar{y}\) 确定),使得 \(c\) 和所有对 \(c\) 的线性组合有贡献的向量 \(a_j\)(即 \(\mu_j > 0\)\(a_j\))在这个方向上的投影都是正的,而没有贡献的向量 \(a_j\)(即 \(\mu_j = 0\)\(a_j\))在这个方向上的投影是非正的。

争抢Farkas引理的证明利用了CQ3这一约束条件。

参考

Convex Analysis and Optimization - Dimitri P. Bertsekas
如何理解fakas引理
约束优化问题的最优性条件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/897780.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android的页面跳转

通过在antivity_xml设置按钮并添加属性 : <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"android:orientation="vertical"android:layout_width=&qu…

第1个服务-定时任务

第1个服务-定时任务 ​ 使用服务的流程: 部署,配置,优化/注意事项,排障,其他(监控,备份,日志,统一认证) ​ 定时任务格式配置 ​ 定时任务案例 ​ 同步时间 备份 终极挑战: 通过脚本取出系统指标,通过邮件发送出去 ​ 定时任务箴言 1.概述定时任务:用于执行在Linux…

第 3 课 - nRF Connect SDK 应用程序的元素 - 配置文件

根据开发者学院的描述,本节课程主要是了解NCS应用程序的结构,了解它们彼此之间的关系以及他们之间如何相互作用。 其中一些概念性的内容需要看官方的描述,我这里只对主要内容做一些总结。最小应用程序文件结构 app/ |-- CMakeLists.txt |-- Kconfig |-- prj.conf |-- <bo…

牛客题解 | 计算矩阵的特征值

牛客题库题解题目 题目链接 矩阵的特征值是指矩阵在某个方向上的拉伸倍数,数学表达式为: \[A \times v = \lambda \times v \]其中,\(A\) 为原矩阵,\(v\) 为特征向量,\(\lambda\) 为特征值。 在数学上,通常求解特征方程来求解特征值: \[det(A - \lambda I) = 0 \]但是,…

光伏龙头出海记:正泰新能易路如何用数字化HR破解全球化用工合规困局

2025开年,全球光伏领域组件供应商龙头企业——正泰新能科技股份有限公司(以下简称“正泰新能”)与易路人力资源科技(以下简称“易路”)合作携手,通过高效、智能、合规的HR数字化解决方案,拓展土耳其乃至全球的光伏市场,促进全球能源转型下的行业发展与技术创新。2025开…

Qt/C++音视频开发82-系统音量值获取和设置/音量大小/静音

一、前言 在音视频开发中,音量的控制分两块,一个是控制播放器本身的音量,绝大部分场景都是需要控制这个,这个不会影响系统音量的设置。还有一种场景是需要控制系统的音量,因为播放器本身的音量是在系统音量的基础上控制的,也就是系统音量30%,意味着播放器最大的音量也是…

信息资源管理综合题之“四个的组织层次”

一、一个组织的运行一般包含战略层、管理层、知识层和操作层四个不同层次的内容,按照信息支持的不同层次,组织中信息系统可以分为六种不同类型,请将下表中序号(1)~(12)所对应的每种系统的中文名称及其对应的典型功能填写在答题卡相应位置处二、答案经理支持系统 长期销售…

如何在 Windows 上实现免密登录 Linux 服务器?

一、环境准备本地系统:Windows 10/11(需启用 OpenSSH 客户端)远程服务器:任意 Linux 发行版(需开启 SSH 服务)工具:系统自带 PowerShell 或 Git Bash(推荐)二、操作步骤 步骤 1:在 Windows 上生成 SSH 密钥对打开 PowerShell 或 Git Bash按 Win + S 搜索 "Power…

Cartesia 升级 TTS 模型,可在音频中无缝填充内容;索尼 AI 游戏角色原型:结合语音与动画,与玩家实时对话丨日报

开发者朋友们大家好:这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑…

NocoBase vs OutSystems:低代码平台,开源还是闭源?

开源 vs. 闭源,哪个低代码平台更适合你?NocoBase vs OutSystems 全面对比,揭示核心功能、成本和扩展性,帮你做出最佳选择!原文链接:https://www.nocobase.com/cn/blog/nocobase-vs-outsystems 引言 我在之前已经写过几篇产品深度对比文章,欢迎感兴趣的朋友前往阅读。Noc…

英格索兰/鑫磊/阿特拉斯空压机数据采集联网远程监控方案温湿度露点

RS132ie-A7.5(英格索兰)RS132ie-A7.5(英格素兰)XLPM175A-IID(鑫磊)GA132-8.5(阿特拉斯)GA132-8.5(阳牛)RS132ie-A7.5(英格索兰)XPM175A-IID(鑫磊)RS132ie-A7.5(英格索兰XLPHI7SA IID (套名)RS1321e-A7.5(英格系兰)XPU175A IID美号RS132ie-A7.5(大格索)RS1321e-A7.5(英格索二RS1…

SpringSecurity5(2-自定义用户信息)

Spring Security允许自定义用户信息以满足特定的认证需求。通过实现UserDetailsService接口,可以从数据库或其他存储源加载用户信息。自定义UserDetails类,提供用户名、密码、权限等信息,并结合Spring Security的AuthenticationManager进行身份验证。这样可以灵活地实现复杂…