【最优化方法】第三次要点整理

news/2025/1/11 23:41:00/文章来源:https://www.cnblogs.com/Mount256/p/18545391

目录
  • 非精确线搜索技术
  • Armijo-Goldstein 准则
  • Wolfe-Powell 准则
  • 强 Wolfe-Powell 准则

【问题】在迭代中,已知 \(x^{(k)}\) 和下降方向 \(d^{(k)}\),如何确定下降步长 \(\alpha^{(k)}\),使得 \(f(x^{(k)} + \alpha^{(k)} d^{(k)}) < f(x^{(k)})\)

非精确线搜索技术

\(\alpha^{(k)}\),使得 \(\Delta f_k = f(x^{(k)}) - f(x^{(k)} + \alpha^{(k)} d^{(k)}) > \epsilon\),即保证 \(f(x)\) 在每一步都有满意的下降,而不必精确计算梯度,从而大大节省计算量。

\[J = \{ \alpha > 0 \ | \ f(x_k + \alpha_k d_k) < f(x_k) \} \]

Armijo-Goldstein 准则

【思想】我们希望优化算法满足以下两个条件:

  1. 目标函数要有足够的下降,使得 \(f(x_{k+1}) < f(x_k)\)
  2. 步长 \(\alpha^{(k)}\) 不能太小,保证每步都要有更新,否则就会出现 \(f(x_{k+1}) \approx f(x_k)\) 的情况。

由第一个条件可得:

\[\begin{aligned} f(x_k + \alpha_k d_k) \leq f(x_k) + \alpha \rho \nabla f(x_k)^\top d_k \\ 或写成:\varphi(\alpha) \leq \varphi(0) + \alpha \rho \varphi'(0) \end{aligned} \]

由第二个条件可得:

\[\begin{aligned} f(x_k + \alpha_k d_k) \geq f(x_k) + \alpha (1-\rho) \nabla f(x_k)^\top d_k \\ 或写成:\varphi(\alpha) \geq \varphi(0) + \alpha (1-\rho) \varphi'(0) \end{aligned} \]

其中 \(0 < \rho < \frac{1}{2}\),保证了 \(\alpha (1-\rho) \varphi'(0) < \alpha \rho \varphi'(0) < 0\)。由下图知:

image

满足第一个条件的 \(\alpha\) 构成区间 \((0, a]\),满足第二个条件的 \(\alpha\) 构成区间 \([b, J]\),因此两个条件构成的约束为 \(\alpha \in [b, a]\)

【算法步骤】由以上思想可得 Goldstein 准则非精确先搜索算法:

初始值设为 \(a_1=0, a_2=M, \alpha>0\)

  • 第一步:计算 \(\varphi(0), \varphi'(0)\),在区间 \([0, M]\) 上选取初始点 \(\alpha\)
  • 第二步:计算 \(\varphi(\alpha)\)
  • 第三步:检查 \(\varphi(\alpha) \leq \varphi(0) + \alpha \rho \varphi'(0)\) 是否满足,若满足则进行第四步;否则 \(a_2 \leftarrow \alpha, \alpha \leftarrow \frac{a_1 + a_2}{2}\),返回第二步。
  • 第四步:检查 \(\varphi(\alpha) \geq \varphi(0) + \alpha (1-\rho) \varphi'(0)\) 是否满足,若满足则输出 \(\alpha_k = \alpha\),结束迭代;否则 \(a_1 \leftarrow \alpha, \alpha \leftarrow \frac{a_1 + a_2}{2}\),返回第二步。

Wolfe-Powell 准则

Goldstein 准则有一个很大的问题是约束区间不一定存在想要的最优点,即 \([b, a]\) 可能把 \(\alpha^*\) 排除在外。为克服上述缺陷,Wolfe 提出了使用以下的条件来代替 Goldstein 中的第二个条件:

\[\begin{aligned} \nabla f(x_k + \alpha_k d_k)^\top d_k \geq \sigma \nabla f(x_k)^\top d_k \\ 或写成:\varphi'(\alpha) \geq \sigma \varphi'(0) \end{aligned} \]

几何意义:对斜率提要求,在可接受点处切线的斜率 \(\varphi'(\alpha)\) 不小于初始斜率的 \(\sigma\) 倍(注意初始斜率小于0)。由下图知:

image

满足第一个条件的 \(\alpha\) 构成区间 \((0, a]\),满足第二个条件的 \(\alpha\) 构成区间 \([e, J]\),因此两个条件构成的约束为 \(\alpha \in [e, a]\)

强 Wolfe-Powell 准则

第二个条件改为:

\[\begin{aligned} | \nabla f(x_k + \alpha_k d_k)^\top d_k | \geq | \sigma \nabla f(x_k)^\top d_k | \\ 或写成:| \varphi'(\alpha) | \geq | \sigma \varphi'(0) | \end{aligned} \]

由上图可知,满足第一个条件的 \(\alpha\) 构成区间 \((0, a]\),满足第二个条件的 \(\alpha\) 构成区间 \([e, f]\),因此两个条件构成的约束为 \(\alpha \in [e, \min(a,f)]\)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/833306.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AlignSum:数据金字塔与层级微调,提升文本摘要模型性能 | EMNLP24

来源:晓飞的算法工程笔记 公众号,转载请注明出处论文: AlignSum: Data Pyramid Hierarchical Fine-tuning for Aligning with Human Summarization Preference论文地址:https://arxiv.org/abs/2410.00409 论文代码:https://github.com/csyanghan/AlignSum创新点发现在文本摘…

快速提升职场效率:从整理任务清单开始

在职场中,我们总会面对各种大小不一的任务,常常让人有种“任务无处不在、却无从下手”的感觉。有效地管理工作,既需要掌握具体的任务管理方法,也需要选择一款适合的工具帮助我们更高效地完成这些任务。今天就从最基础的“整理任务清单”说起,分享一些提高职场效率的实用技…

ABB IRB5500喷涂机器人电机维修故障方法

ABB喷涂机器人电机在运行过程中可能会遇到多种常见故障,用户需根据电机的实际运行状况,细致地进行故障辨析并采取适当的处理措施。在进行维修作业时,务必严格遵守安全操作规程,确保不会对机器人本身及维修人员造成任何伤害。 一、ABB喷涂机器人电机维修故障现象的初步判断与…

NocoBase 本周更新汇总:提升工作流易用性

汇总一周产品更新日志,最新发布可以前往我们的博客查看。 NocoBase 目前更新包括两个分支:main 和 next 。 main :截止目前最稳定的版本,推荐安装此版本。 next:内测版,包含一些未发布的新特性,这个版本可能还不完全稳定,适用于开发者或测试人员,用于提前体验新功能或…

AD(活动目录)环境下使用kms服务自动激活域里windows

AD(活动目录)环境下使用kms服务自动激活域里windows 做基础架构运维对AD域架构和kms激活应该是比较熟悉的,关于kms激活服务器搭建,可以看看网上的相关资料,其安装在CentOS比较稳定,当然也支持其他类似的OS。安装过程不再赘述了。希望能够帮助大家! 可以参考: bbs.pcbet…

Mac和安卓手机互传文件(ADB)

点赞 + 关注 + 收藏 = 学会了 本文简介 今年的 Mac mini M4 真的鲨疯了,丐版原价4字头,领到国补的3字头可以拿下。相信很多想体验 macOS 的工友都蠢蠢欲动了。 但是,电脑便宜了,手机可不便宜。对于正在使用 「苹果电脑 + 安卓手机」 的工友来说,想让这两设备互传体积大、数…

什么是数字图像?

点赞 + 关注 + 收藏 = 学会了 什么是数字图像? 弄懂数字图像的概念对学习计算机视觉很有帮助。 那么,什么是数字图像? 字面意思,数字图像就是有数字组成图像。通常由像素(Pixel)组成,每个像素包含颜色或亮度信息。数字图像的格式包括位图和矢量图两种主要类型:位图图像…

经销商文件外发,如何实现安全与效率的双赢?

经销商文件外发是指经销商在业务运营过程中,与供应商、客户、合作伙伴以及其他相关方之间进行的文件接收和发送活动。这些文件涵盖了订单、发票、合同、产品目录、库存报告、市场活动资料、运输单据、客户反馈等多种类型,对于经销商的日常运营、业务管理、客户关系维护以及决…

发布的网站代码修改,如何在生产环境中安全地修改已发布的网站代码

在生产环境中修改已发布的网站代码需要谨慎操作,以确保网站的稳定性和安全性。以下是具体步骤:备份网站:在修改前,备份当前的网站文件和数据库,确保数据安全。 使用FTP工具或数据库管理工具进行备份。创建测试环境:在本地或开发服务器上创建一个与生产环境一致的测试环境…

织梦网站在哪里修改图片的alt,如何在织梦后台或代码编辑器中修改图片的Alt属性

登录织梦后台:打开浏览器,输入织梦网站的后台地址,例如 http://yourdomain.com/dede。 输入管理员账号和密码,点击“登录”。进入内容管理:登录后,点击顶部菜单栏中的“内容”。 选择“文档管理”或“文章管理”。选择需要修改的文章:在文档管理页面中,找到需要修改的文…

修改网站模板布局的软件,如何使用专业的软件修改网站模板布局

使用专业的软件可以更高效地修改网站模板布局。以下是一些常用的软件及其使用方法:Adobe Dreamweaver:安装软件:从Adobe官网下载并安装Dreamweaver。 打开项目:使用Dreamweaver打开网站项目文件夹。 修改布局:在设计视图中拖放元素,调整布局。 保存文件:修改完成后,保存…

Mysql篇-三大日志

概述undo log(回滚日志):是 Innodb 存储引擎层生成的日志,实现了事务中的原子性,主要用于事务回滚和 MVCC。 redo log(重做日志):是 Innodb 存储引擎层生成的日志,实现了事务中的持久性,主要用于掉电等故障恢复; binlog (归档日志):是 Server 层生成的日志,主要…