R函数optim()最小化或者最大化多参数函数

一、optimize()最小化或者最大化单参数函数

1.1函数介绍

函数功能描述:给定一个单参数函数f,需要找到使得f达到其最小值或者最大值的点。

使用optimize()函数最小化单参数函数时,需要指定最小化的函数f及其定义域(x的上界和下界):

optimize(f, lower = lowerBound, upper = upperBound)

如果需要最大化函数,需要指定参数maximum=TRUE,即

optimize(f, lower = lowerBound, upper = upperBound, maximum = TRUE)

1.2示例

optimize()函数可以对单参数函数求最大值或者最小值。它需要在参数中指明需要求极值的函数的自变量x的取值范围。

以下示例查找多项式函数:3x^{4}-2x^{3}+3x^{2}-4x+5的最小值:

f <- function(x){x*x^4- 2*x^3+ 3*x^2-4*x+5
}optimize(f, lower=-20, upper=20)
#或者
#optimize(f, c(-20, 20)) #被优化的范围是-20,20#$minimum
#[1] -19.99995
#
#$objective
#[1] -3182675

 optimize()函数返回的值是一个包含两个元素的列表:其中minimum表示使得f达到最小值时的x,objective表示函数在该点x所达到的最小值。

如果参数lower和upper的距离较小,它意味着搜索的区域较小,最优化的速度将较快。如果你不确定适当的搜索范围,请使用较大但合理的范围,例如lower=-1000, upper=1000。

注意,函数在该范围内不要有多个最小值或者最大值!optimize函数将只找到并返回一个最小值或者最大值。

二、optim()最小化或者最大化多参数函数

2.1函数介绍

给定多参数函数f,需要找到使函数f达到其最小值或者最大值

  • 要最小化多参数函数,使用optim,这里必须指定起始点,它时函数f的初始参数向量。

optim(startingPoint, f)

  • 要最大化多参数函数,需要指定参数control;或者在被优化函数前加负号
optim(startingPoint, f, control=list(fnscale = -1))

函数optim比optimize更通用,因为optim函数可以处理多参数函数。optim函数会将函数f自变量的取值放在一个向量中,然后估计函数在该向量上的取值。函数的取值是一个纯量值(一个数值)。optim函数将从设定的起点开始,在自变量的定义域内搜索函数的最小值。

optim()函数还提供了method参数,来选择优化函数的的算法,默认使用内尔德-米德算法作为最优化算法,其他可用的算法还有准牛顿算法、共轭梯度法和模拟退火法等方法,它们都是针对多维情形设计的最优化算法。

2.2示例

示例1:

极小化目标函数:100*(x_{2}-x_{1}^{2})^{2}+(1-x_1)^2,其中x_1x_2是未知变量。

fr <- function(x) {   ## Rosenbrock Banana functionx1 <- x[1]x2 <- x[2]100 * (x2 - x1 * x1)^2 + (1 - x1)^2
}
optim(c(-1.2,1), fr)#$par
#[1] 1.000260 1.000506
#
#$value
#[1] 8.825241e-08
#
#$counts
#function gradient 
#     195       NA 
#
#$convergence
#[1] 0
#
#$message
#NULL

上述代码调用optim函数,从(-1.2, 1)开始搜索f的最小值。

返回的列表包括一个分量convergence,它的值显示optim函数是否找到了f的最小值,如果该分量的值为0,那么optim找到了最小值;否则,表明optim函数没有找到最小值。显然,convergence的值是重要的返回值,因为如果算法没有收敛,其他返回值是没有意义的。

返回的列表还包括分量par,它是最小化函数的参数;分量value,是在par处的函数值f(par)。

在上述这个例子中,optim函数是收敛的,并且在大约x_1=1.000260x_2=1.000506处找到了最小值。

示例2:

给出一个使用optim来拟合非线性模型的示例。

要极小化的目标函数:\sum_{i}^{n}|z_{i}-(x_{i}-a)^{b}|,其中a和b是未知参数。换句话说,我们要极小化的目标函数中具备两个参数,这两个参数构成了一个参数向量,这个参数向量的第一个元素是a,第二个元素是b。

#load(file ="./data/opt.rdata") #load x, y, zf <- function(v) {a <- v[1]b <- v[2]
sum(abs(z-((x+a)^b)))
}optim(c(1,1), f)

三、optim函数和optimize函数的区别

  • 对于函数optim而言,这个函数不用指定参数指明搜索的下界和上界,仅仅需要提供一个搜索的起点。对起点的一个好的猜测,意味着最优化算法的加快。换句话说,optim优化函数,需要有一个好的未知参数的初始值。初始值即为搜索的起点。其次,optim函数是用来优化目标函数中具有多个未知参数的函数。
  • 对于optimize函数,这个函数需要指定搜索的上界和下界,此外,这个函数只能优化一个未知参数的函数。

参考:

《R语言经典实例(原书第2版)》(2020年5月出版,机工社)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/125403.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自然语言处理 | WordNet

WordNet是词汇数据库,即英语词典,专为自然语言处理而设计。 Synset是一种特殊的简单接口,存在于 NLTK 中, 用于在 WordNet 中查找单词。同义词集实例是表达相同概念的同义词的分组。有些单词只有一个同义词集,有些则有多个。

坦克世界WOT知识图谱三部曲之爬虫篇

文章目录 关于坦克世界1. 爬虫任务2. 获取坦克列表3. 获取坦克具体信息结束语 关于坦克世界 《坦克世界》(World of Tanks, WOT)是我在本科期间玩过的一款战争网游&#xff0c;由Wargaming公司研发。2010年10月30日在俄罗斯首发&#xff0c;2011年4月12日在北美和欧洲推出&…

【算法】排序——归并排序和计数排序

主页点击直达&#xff1a;个人主页 我的小仓库&#xff1a;代码仓库 C语言偷着笑&#xff1a;C语言专栏 数据结构挨打小记&#xff1a;初阶数据结构专栏 Linux被操作记&#xff1a;Linux专栏 LeetCode刷题掉发记&#xff1a;LeetCode刷题 算法头疼记&#xff1a;算法专栏…

分布式操作系统

分布式操作系统属于多机操作系统&#xff0c;能够统一一套计算机集群&#xff0c;相比单机系统&#xff0c;分布式操作系统在管理计算机集群方面要简单很多。各种分布式的基础功能&#xff0c;都集中到分布式操作系统来实现&#xff0c;而不是单机系统的应用软件来实现&#xf…

如何使用 Dijkstra 算法找到从源到所有顶点的最短路径--附C++/Java源码

给定一个图和图中的源顶点,找到从源到给定图中所有顶点的最短路径。 例子: 输入: src = 0,图形如下图所示。 输出: 0 4 12 19 21 11 9 8 14解释:从 0 到 1 的距离 = 4。 从 0 到 2 的最小距离 = 12。0->1->2 从 0 到 3 的最小距离 = 19。0 ->1-

目标检测算法改进系列之Backbone替换为InceptionNeXt

InceptionNeXt 受 Vision Transformer 长距离依赖关系建模能力的启发&#xff0c;最近一些视觉模型开始上大 Kernel 的 Depth-Wise 卷积&#xff0c;比如一篇出色的工作 ConvNeXt。虽然这种 Depth-Wise 的算子只消耗少量的 FLOPs&#xff0c;但由于高昂的内存访问成本 (memory…

位置编码器

目录 1、位置编码器的作用 2、代码演示 &#xff08;1&#xff09;、使用unsqueeze扩展维度 &#xff08;2&#xff09;、使用squeeze降维 &#xff08;3&#xff09;、显示张量维度 &#xff08;4&#xff09;、随机失活张量中的数值 3、定义位置编码器类&#xff0c;我…

6.Tensors For Beginners-What are Convector

Covectors &#xff08;协向量&#xff09; What‘s a covector Covectors are “basically” Row Vectors 在一定程度上&#xff0c;可认为 协向量 基本上就像 行向量。 但不能简单地认为 这就是列向量进行转置&#xff01; 行向量 和 列向量 是根本不同类型的对象。 …

【JavaEE】多线程(五)- 基础知识完结篇

多线程&#xff08;五&#xff09; 文章目录 多线程&#xff08;五&#xff09;volatile关键字保证内存可见性JMM&#xff08;Java Memory Model&#xff09; 不保证原子性 wait 和 notifywait()notify()线程饿死 上文我们主要讲了 synchronized以及线程安全的一些话题 可重入…

最短路径专题6 最短路径-多路径

题目&#xff1a; 样例&#xff1a; 输入 4 5 0 2 0 1 2 0 2 5 0 3 1 1 2 1 3 2 2 输出 2 0->1->2 0->3->2 思路&#xff1a; 根据题意&#xff0c;最短路模板还是少不了的&#xff0c; 我们要添加的是&#xff0c; 记录各个结点有多少个上一个结点走动得来的…

C++设计模式-抽象工厂(Abstract Factory)

目录 C设计模式-抽象工厂&#xff08;Abstract Factory&#xff09; 一、意图 二、适用性 三、结构 四、参与者 五、代码 C设计模式-抽象工厂&#xff08;Abstract Factory&#xff09; 一、意图 提供一个创建一系列相关或相互依赖对象的接口&#xff0c;而无需指定它们…

sheng的学习笔记-【中英】【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第四周测验

课程1_第4周_测验题 目录&#xff1a;目录 第一题 1.在我们的前向传播和后向传播实现中使用的 “缓存” 是什么&#xff1f; A. 【  】它用于在训练期间缓存成本函数的中间值。 B. 【  】我们用它将在正向传播过程中计算的变量传递到相应的反向传播步骤。它包含了反向传…