【最优化方法】第六次要点整理

news/2024/12/12 9:28:25/文章来源:https://www.cnblogs.com/Mount256/p/18601495

目录
  • 拟牛顿法的思想
  • 拟牛顿法的条件
  • 拟牛顿法的步骤
  • 校正矩阵的确定
    • SR1 校正(对称秩 1 校正)
    • DFP 校正
    • BFGS 算法

拟牛顿法的思想

牛顿法的迭代方程为:

\[d_k = - (\nabla^2 f(x_k))^{-1} \nabla f(x_k) \]

牛顿法的优缺点:

  • 优点:局部二阶收敛,速度快。
  • 缺点:每步都要计算 Hessian 矩阵 \(\nabla^2 f(x_k)\),运算量大,还要求函数至少二阶连续可微。

拟牛顿法的核心思想:每步用 \(B_k\) 近似取代 \(\nabla^2 f(x_k)\),其满足以下条件:

  • 某种意义下,\(B_k \approx \nabla^2 f(x_k)\)
  • \(B_k\) 对称且正定,以产生下降方向(即保持下降性)
  • \(B_k\) 的更新与计算要简单,只需函数的一阶信息

拟牛顿法的条件

\(f(x)\) 是二阶连续可微函数,对 \(\nabla f(x)\) 在点 \(x_{k+1}\) 处进行一阶泰勒近似:

\[\nabla f(x) \approx \nabla f(x_{k+1}) + \nabla^2 f(x_{k+1}) (x-x_{k+1}) \]

\(x = x_k\),则:

\[\nabla f(x_{k+1}) - \nabla f(x_k) \approx \nabla^2 f(x_{k+1}) (x_{k+1}-x_k) \]

记:

  • 位移差:\(s_k = x_{k+1}-x_k\)
  • 梯度差:\(y_k = \nabla f(x_{k+1}) - \nabla f(x_k)\)

由此得到:

\[\nabla^2 f(x_{k+1}) s_k \approx y_k \]

由拟牛顿法的思想,我们希望 \(B_{k+1}\) 满足:

\[B_{k+1} s_k \approx y_k \]

\(H_{k+1} = B_{k+1}^{-1}\),则有:

\[H_{k+1} y_k \approx s_k \]

上述两个方程又被称为割线方程。

拟牛顿法的步骤

拟牛顿法:

  • 第一步:选取初始点 \(x_0\)\(H_0 = I\),给定终止误差 \(\varepsilon > 0\) ,令 \(k=0\)
  • 第二步:计算 \(\nabla f(x_k)\),若 \(|| \nabla f(x_k) || \leq \varepsilon\),停止迭代并输出 \(x^*=x_k\);否则进行第三步
  • 第三步(搜索方向):计算搜索方向 \(d_k = -H_k \nabla f(x_k)\)
  • 第四步(迭代更新):计算 \(x_{k+1} = x_k + d_k\)
  • 第五步(更新 \(H_k\)):计算 \(H_{k+1} = g(H_k)\)

拟阻尼牛顿法:

  • 第一步:选取初始点 \(x_0\)\(H_0 = I\),给定终止误差 \(\varepsilon > 0\) ,令 \(k=0\)
  • 第二步:计算 \(\nabla f(x_k)\),若 \(|| \nabla f(x_k) || \leq \varepsilon\),停止迭代并输出 \(x^*=x_k\);否则进行第三步
  • 第三步(搜索方向):计算搜索方向 \(d_k = -H_k \nabla f(x_k)\)
  • 第四步(线搜索):通过线搜索确定步长 \(\alpha_k\)
  • 第五步(迭代更新):计算 \(x_{k+1} = x_k + \alpha_k d_k\)
  • 第六步(更新 \(H_k\)):计算 \(H_{k+1} = g(H_k)\)

现在的关键要点是:如何更新 \(H_k\) 且保持其对称正定性以及计算简单?想法如下:

\[H_{k+1} = H_k + D_k 或 B_{k+1} = B_k + E_k \]

其中要求 \(D_k\)\(E_k\) 的生成要尽量简单,被称为校正矩阵

校正矩阵的确定

SR1 校正(对称秩 1 校正)

为保证 \(D_k\) 是秩 1 矩阵且 \(H_k\) 对称,可设 \(D_k = \alpha u u^\top\)。将该式带入到割线方程中,经过一系列推导后可得 SR1 校正公式:

\[H_{k+1} = \begin{cases} H_k + \frac{(s_k-H_ky_k)(s_k-H_ky_k)^\top}{(s_k-H_ky_k)^\top y_k} ,\ &若 (s_k-H_ky_k)^\top y_k \neq 0 \\ H_k, \ &若 (s_k-H_ky_k)^\top y_k=0 \end{cases} \]

其对偶式为:

\[B_{k+1} = B_k + \frac{(y_k-B_ks_k)(y_k-B_ks_k)^\top}{(y_k-B_ks_k)^\top s_k} \]

注:

  • SR1 校正产生的 \(H_{k+1}\) 满足对称性,但不一定正定,即搜索方向不一定是下降的;
  • 无法保证 \((s_k-H_ky_k)^\top y_k > 0\),导致 \(H_{k+1}\) 可能非正定。

DFP 校正

\(H_{k+1}\)\(H_k\) 经对称秩 2 校正产生,即 \(D_k = \alpha u u^\top + \beta v v^\top\)。将该式带入到割线方程中,经过一系列推导后可得 DFP 校正公式:

\[H_{k+1} = H_k + \frac{s_k s_k^\top}{s_k^\top y_k} - \frac{H_ky_k (H_ky_k)^\top}{y^\top H_ky_k} \]

DFP 校正产生的 \(H_{k+1}\) 满足对称性且正定。

注:

  • \(s_k^\top y_k > 0\) 在实际应用中是容易满足的条件:
    • 采用精确线搜索和非精确的 Wolfe-Powell 准则时,条件一定满足;
    • 采用非精确的 Armijo-Goldstein 准则时,条件可能不满足,当不满足时直接令 \(H_{k+1} = H_k\)
  • 当求解大规模非线性优化时,\(H_k\) 可能越来越接近奇异矩阵,使得算法“卡住”;
  • 如果求解二次正定优化问题时,令 \(H_0=I\),则 DFP 算法是共轭梯度法。

BFGS 算法

与 DFP 的校正思路和过程类似,但 BFGS 构造的是 \(B_{k+1}\),经过一系列推导后可得到 BFGS 的校正公式:

\[B_{k+1} = B_k + \frac{y_k y_k^\top}{y_k^\top s_k} - \frac{B_ks_k (B_ks_k)^\top}{s^\top B_ks_k} \]

BFGS 校正产生的 \(B_{k+1}\) 满足对称性且正定。

注:

  • \(y_k^\top s_k > 0\) 在实际应用中是容易满足的条件:
    • 采用精确线搜索和非精确的 Wolfe-Powell 准则时,条件一定满足;
    • 采用非精确的 Armijo-Goldstein 准则时,条件可能不满足,按如下公式进行更新(此式有现成图片,就懒得自己打一遍了):
      image
  • 实际应用中,BFGS 更新 \(H_k\),通过 \(d_{k+1} = - H_{k+1} \nabla f(x_{k+1})\) 产生下降方向。
  • BFGS 和 DFP 形式上是对偶的:

image

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/851221.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

抽烟监测识别摄像机

抽烟识别摄像机是一种利用计算机视觉和人工智能技术的设备,能够实时监测和识别吸烟行为。该摄像机通过分析人体姿态和动作,识别出可能的吸烟行为,并及时发出警告或报警。这种摄像机可以广泛应用于公共场所、办公场所、学校和医疗机构等地方,帮助管理者有效监控吸烟行为,及…

OpenAPI 与 国产 Solon 框架支持,Fast Request 2024.1.9 发布

Fast Request是一个类似于 Postman 的 IDEA 插件。它是一个强大的 restful api 工具包插件,可以根据已有的方法帮助您快速、自动生成 url 和 params。 Restful Fast Request = API 调试工具 + API 管理工具 + API 搜索工具。 它有一个漂亮的界面来完成请求、检查服务器响应、存…

EtherNet/IP 转 Modbus 网关作用下 AB PLC 控制变频器的案例呈现

在工业自动化控制系统中,常常会遇到不同品牌和通信协议的设备需要协同工作的情况。本案例中,客户现场采用了 AB PLC,但需要控制的变频器仅支持 Modbus 协议。为了实现 AB PLC 对变频器的有效控制与监控,引入了捷米特 JM-EIP-RTU 网关来完成 EtherNet/IP 与 Modbus 之间的协…

Qt编写RK3588视频播放器/支持RKMPP硬解/支持各种视音频文件和视频流/海康大华视频监控

一、前言 用ffmpeg做硬解码开发,参考自带的示例hw_decode.c即可,里面提供了通用的dxva2/d3d11va/vaapi这种系统层面封装的硬解码,也就是无需区分用的何种显卡,操作系统自动调度,基本上满足了各种场景的需要,这种方式很通用也便捷,但是一些特殊场景必须要用指定硬解码器名…

apisix~转发到某个静态页

路由转发(也称为请求转发或反向代理)是一个核心功能,它允许将客户端的请求转发到后端服务器。Nginx 广泛用于处理高并发的请求,并能够有效地分配流量和管理负载。以下是关于 Nginx 路由转发的一些基本理论和概念。 反向代理 通常作为反向代理服务器工作,接收来自客户端的请…

网络隔离不再是障碍:Ftrans跨网软件让数据流动更自由安全!

企业研发数据对企业而言具有至关重要的意义,特别是以研发为核心业务及定位的企业,如半导体 IC 设计、生物制药、科研单位等,研发数据就是其最核心的数据资产,研发成果就是其生命力的根本。 企业为保护网络安全和数据安全,使用网络隔离手段进行网络隔离,比如银行内部将网…

Ftrans国产FTP工具,让文件传输更快捷、更安全!

多个行业都存在国产FTP工具的替代需求,这主要源于对传统FTP工具在安全性、效率、管理便捷性等方面的不足的认识,以及对更高效、更安全、更易于管理的文件传输解决方案的追求。 传统FTP在安全性、效率、管理便捷性等方面的局限性: 1.安全性差:明文传输,漏洞频发,容易遭到…

macOS Sequoia 15.2 发布下载,带来 Apple 智能重大更新

macOS Sequoia 15.2 (24C101) 正式版 ISO、IPSW、PKG 下载macOS Sequoia 15.2 (24C101) 正式版 ISO、IPSW、PKG 下载 iPhone 镜像、Safari 浏览器重大更新和 Apple Intelligence 等众多全新功能令 Mac 使用体验再升级 请访问原文链接:https://sysin.org/blog/macOS-Sequoia/ 查…

MaxKB-MaxKB修改登录界面LOGO和隐藏用户“关于”选项

一、删除右上角图标MaxKB\MaxKB-main\ui\src\layout\components\top-bar\index.vue删除用户“关于”选项 MaxKB\ui\src\layout\components\top-bar\avatar\index.vue修改登录界面LOGO MaxKB\MaxKB-main\ui\src\assets\login.jpg MaxKB\MaxKB-main\ui\src\assets\ MaxKB-logo.sv…

Spring框架IoC核心详解

介绍 IoC(Inversion of Control:控制反转) 是一种设计思想,而不是一个具体的技术实现。IoC 的思想就是将原本在程序中手动创建对象的控制权,交由 Spring 框架来管理,由Spring容器管理bean的整个生命周期。通俗来说就是IoC是设计思想,DI是实现方式。 通过反射实现对其他对…

【.NET】Windows 上快速部署.NET Core Web 项目

一、为什么在 Windows 上部署二、Kestrel 服务器的高性能三、将.NET Core 项目作为 Windows 服务四、使用 WinSW 将.NET Core 项目作为 Windows 服务五、案例一、为什么在 Windows 上部署 在企业环境中,可能已经存在大量基于 Windows 的服务器和服务。如果你的.NET Core 项目需…

【Linux运维】利用categraf的exec插件实现对Linux主机系统用户及密码有效期进行监控及告警

需求描述 Categraf作为夜莺监控平台的数据采集工具,为了保障Linux主机的安全,需要实现对系统用户密码有效期的监控,并在密码即将到期时及时告警,以提醒运维人员更改密码。本章将详细介绍如何利用Categraf的exec插件来实现这一功能,并确保告警信息能够通过企业微信、飞书等…