前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【专题】公共数学_多元函数极值专题

【专题】公共数学_多元函数极值专题

作者头像
一只野生彩色铅笔
发布2022-09-20 11:12:33
1.6K0
发布2022-09-20 11:12:33
举报
文章被收录于专栏:彩铅的随笔博客

Author: Colopen 彩色铅笔

Link: https://www.colopen-blog.com

Download the pdf: 多元函数极值专题.pdf

last publication: 2021-12-11 18:00


无条件极值

无条件极值属于多元函数极值中,较为简单的一类问题,其解决的问题描述一般是:

[ \text{给定一个多元函数 } z=f(x,y)\text{,求解他在实数域上的极值} ]

解决该类问题的思路也很简单,直接沿用我们在 一元函数 中的手段:通过 驻点极值点

z

x,y

分别求 偏导,然后令 一阶偏导数 为零,找出 驻点

如何判断 驻点 是否是 极值点 ?常用手段是 黑塞矩阵(Hessian Matrix)判别式

他是用于研究函数在一点处 曲率 的变化而存在的(就像一元函数求二阶导数的行为,本质相同)

黑塞矩阵判别式:

\begin{vmatrix}f_{xx} & f_{xy} \\\\f_{yx} & f_{yy}\end{vmatrix} \xlongequal{?} 0

黑塞矩阵判别式

  1. 大于
0

,则该驻点是极值点

f_{xx} > 0

则为极小值点

f_{xx} < 0

则为极大值点

  1. 小于
0

,则该驻点不是极值点

  1. 等于
0

,则 判别式失效判别式失效 时,我们可以利用 极值的定义,然后通过一个 二元极限 判断该点是否是极值点

  1. 如果找到两条路径,一条路径极限大于该点值,一条路径极限小于该点值,则非 极值点
  2. 如果 去心邻域 内的值都大于或小于该驻点的值,则该驻点为极值点

关于 无条件极值,各大辅导书上步骤都有详细讲解,故这里就不准备例题了,只帮助大家理清思路

条件极值

条件极值 是考研中常考的,方法超固定,计算超复杂的一类问题

条件极值 围绕着 目标函数约束条件 两个关键字展开

求解的是 目标函数约束条件 下的 极值 问题

其问题描述一般为:

[ \text{已知函数 }z = f(x,y) \text{,求解 }z \text{ 在约束条件 } D = \{(x,y)|g(x,y)=0\}\text{ 下的最值} ]

通法拉格朗日数乘法:是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法

构造如下方程组:

[ L(x,y,\lambda) = f(x,y) + \lambda g(x,y) \xlongequal{\text{令}} 0 ]
[ \begin{cases} L_x = f_x(x,y) + \lambda g_x(x,y) \xlongequal{\text{令}} 0 \\ L_y = f_y(x,y) + \lambda g_y(x,y) \xlongequal{\text{令}} 0 \\ L_\lambda = g_x(x,y) \xlongequal{\text{令}} 0 \end{cases} ]

然后解该方程组,便可以得到 目标函数约束条件 下的 极值点

然后比较几个 极值点,选出 最大最小值 即可

不过 条件极值 难,从来都不是难在做法上,而是构造的 拉格朗日数乘法方程 难解 接下来的内容,将会围绕优化解方程出发,分享几个我常用的方法

利用轮换对称式化简拉格朗日乘子

在下方的 利用齐次式化简拉格朗日乘子 中介绍过:(这个专题我是从下往上写的 w)

拉格朗日函数 是一个 多项式函数,可以利用很多 多项式的特性 对计算进行化简

而本篇中,提到的方法便是 轮换对称式

二元轮换对称式 的定义: 对于一个二元多项式

f(x,y)

,如果用

x

代替

y

,用

y

代替

x

,后 代数式 保持不变,则称

f(x,y)

具有 轮换对称性 上述定义可以扩充到

n

元,此外 二元轮换对称式 也是一个 完全对称式 轮换对称性用简单一个点的话来说就是,如果交换

x,y

后,

f(x,y)

保持不变

对于具有 轮换对称性 的函数,一定有解

y = x

因此我们不妨直接让

L_x - L_y

然后提出

(y-x)

的因式

然后分类讨论两个因式分别为

0

的解

【例】设计一个容积为

V

的长方体开口水箱,长宽高分别为多少时最节省材料

【解】根据题意可得 目标函数:

S = 2xz + 2zy + xy

,约束条件

V = xyz

构造拉格朗日函数:

L = 2xz + 2zy + xy + \lambda (xyz - V)

显然

x,y

具有轮换对称性

[ \begin{cases} L_x = 2z + y + \lambda yz \xlongequal{\text{令}} 0 \\ L_y = 2z + x + \lambda xz \xlongequal{\text{令}} 0 \\ L_z = 2x + 2y + \lambda xy \xlongequal{\text{令}} 0 \\ L_\lambda = xyz \xlongequal{\text{令}} V \end{cases} ]

利用轮换对称性,让

L_x - L_y

得:

[ \begin{aligned} (y-x) + \lambda z(y - x) &= 0 \\ (y-x) \cdot (1 + \lambda z) &= 0 \\ \end{aligned} ]
x = y

时:

L_z: 4x + \lambda x^2 = 0 \Rightarrow x(4 + \lambda x) = 0 \Rightarrow \lambda = -\dfrac{4}{x}
L_\lambda : z = \dfrac{V}{x^2}

L_x : \dfrac{2V}{x^2} + x - 4 \cdot \dfrac{V}{x^2} = 0 \Rightarrow x^3 = 2V \Rightarrow x = \sqrt[3]{2V}

\begin{cases} x = \sqrt[3]{2V} \\ y = \sqrt[3]{2V} \\ z = \dfrac{\sqrt[3]{V}}{2^{\frac{2}{3}}} \end{cases}
1 + \lambda z = 0

时:

L_x : -\dfrac{2}{\lambda} + y - y = 0 \Rightarrow \dfrac{2}{\lambda} = 0

无解

由于题目保证一定有解,故最小值解为:

\begin{cases} x = \sqrt[3]{2V} \\ y = \sqrt[3]{2V} \\ z = \dfrac{\sqrt[3]{V}}{2^{\frac{2}{3}}} \end{cases}

2013年超难解的多元极值问题,就可以利用本技巧化简运算,读者可以去试一下

三角换元法

这个方法很简单,本质就是沿用了大家在 二重积分 里常用的 极直互化 技巧

考虑按照 约束条件 的形式,将 直角坐标 转化成 极坐标 形式

这样就从原来的

f(x,y)

极值问题,转化为

f(r,\theta)

极值问题

由于是基于 约束条件 转换的坐标,转化过来后

r,\theta

是带着 约束条件取值范围限制

f(r,\theta)

最后可以通过 三角恒等变形 化成一个

ar\sin(\theta + \varphi)

的形式

然后就可以根据

r

范围直接写出

f

取值范围

【例】

4x^2+y^2 \le 25

,求

L = x^2 + 12xy + 2y^2

的取值范围

【解】根据 约束条件 的形式,进行 极直互化

不妨令

2x = r\cos \theta

y = r\sin \theta

,则

r^2 \le 25 \Rightarrow (0 \le r \le 5

0 \le \theta \le 2\pi)

目标函数极坐标

[ \begin{aligned} L &= x^2 + 12xy + 2y^2 \\ &= \dfrac{r^2}{4}\cos^2\theta + 6r^2\sin\theta\cos\theta + 2r^2\sin^2\theta \\ &= \dfrac{r^2}{4} \cdot \dfrac{1+\cos 2\theta}{2} + 3r^2\sin 2\theta + 2r^2\cdot \dfrac{1-\cos 2\theta}{2} \\ &= \dfrac{r^2}{8} + \dfrac{r^2}{8}\cos 2\theta + 3r^2\sin 2\theta + r^2 - r^2\cos 2\theta \\ &= \dfrac{r^2}{8} \cdot \bigg({ 9 + 24\sin 2\theta - 7\cos 2\theta }\bigg) \\ &= \dfrac{r^2}{8} \cdot \bigg({ 9 + \sqrt{24^2 + 7^2} \sin(2\theta + \varphi) }\bigg) \\ &= \dfrac{r^2}{8} \cdot \bigg({ 9 + 25 \sin(2\theta + \varphi) }\bigg) \\ \end{aligned} ]

由于

\theta \in [0, 2\pi], r \in [0, 5]

,故

f(r,\theta)\in [-50, \dfrac{425}{4}]

该方法同样适用于 三个变量平方和的等式 下 由于是等式,故可以选择两个变量建立极坐标,让第三个变量代替

r

作为参数限制 如下面这题

【例】

x^2+y^2+z^2=10

,求

L = xy + 2yz

的取值范围

【解】对

L

进行变形:

L = y \cdot (x + 2z)

,考虑围绕

x,z

建立极坐标

对约束条件进行恒等变形:

x^2 + z^2 = 10 - y^2

建立极坐标:

x = \sqrt{10 - y^2} \cos \theta, z = \sqrt{10 - y^2} \sin \theta

易得

-\sqrt{10} \le y < \sqrt{10}

0 \le \theta \le 2\pi

对目标函数进行换元:

[ \begin{aligned} L &= y \cdot \bigg({ \sqrt{10 - y^2} \cos\theta + 2\sqrt{10 - y^2}\sin\theta }\bigg) \\ &= y \sqrt{10 - y^2} \cdot \sqrt{5} \sin (\theta + \varphi) \end{aligned} ]

根据

y\in[-\sqrt{10},\sqrt{10}]

,有

y\sqrt{10-y^2} \in [-5, 5]

(读者自证不难)

\sqrt{5} \sin (\theta + \varphi) \in [-\sqrt{5}, \sqrt{5}]

L = y \sqrt{10 - y^2} \cdot \sqrt{5} \sin (\theta + \varphi) \in [-5\sqrt{5}, 5\sqrt{5}]

利用齐次式化简拉格朗日乘子

部分参考自 [@考研竞赛凯哥](),及其他参考文献

这一部分,有一些数学知识作为前置铺垫,不过最后得出来的结论相当简单 如果没有想要了解的想法,只是以考试为主要目的的同学,可以直接往下滑

多元函数条件极值 问题时,需要用到 拉格朗日乘数法 构造 拉格朗日函数

[ L(x_1,x_2,x_2,\lambda) = f(x_1,x_2,x_3) + \lambda [g(x_1,x_2,x_3) - m] ]

其中

\lambda

为参数

由于

\lambda

是作为参数存在的,故研究 拉格朗日函数 实际上是在研究一个 多项式函数

而当研究对象转换到 多项式函数 后,就可以用到很多 特殊多项式函数 的性质

例如,本篇中会介绍的 齐次函数(如果该次数是二次型,推荐用下一个二次型解法)

k 次式的齐次函数定义 为:

f(\lambda x_1,\lambda x_2,\cdots,\lambda x_n) = \lambda^kf(x_1,x_2,\cdots,x_n)

对于

k

齐次函数 ,有 齐次函数欧拉定理

[ x_1\dfrac{\partial f}{\partial x_1} + x_2\dfrac{\partial f}{\partial x_2} + \cdots + x_n\dfrac{\partial f}{\partial x_n} = k f(x_1,x_2,\cdots,x_n) ]

简单证明: 对于

k

次齐次函数

f(x_1,x_2,\cdots,x_n)

,对定义式两边求全微分:

[ \dfrac{d}{d\lambda} f(\lambda x_1,\lambda x_2,\cdots,\lambda x_n) = \sum_{i=1}^n \dfrac{\partial f}{\partial(\lambda x_i)} \cdot \dfrac{d(\lambda x_i)}{d\lambda} = \sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)} ]
[ \dfrac{d}{d\lambda} \lambda^k f(x_1,x_2,\cdots,x_n) = k\lambda^{k-1}f(x_1,x_2,\cdots,x_n) ]

通过这个 算两次 的思想,由于两个 全微分 必相等,于是:

[ \sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)} = k\lambda^{k-1}f(x_1,x_2,\cdots,x_n) ]

\lambda = 1

,得:

[ \sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)} = kf(x_1,x_2,\cdots,x_n) \qquad QED ]

回到 多元函数条件极值 问题上来

若目标函数

f

和约束条件

g = m

满足

f

g

k

次多项式,那么

F = f + \lambda g

也是

k

次多项式。

对于 拉格朗日乘子

L = f + \lambda(g-m)

L_x = 0, L_y = 0

可以考虑

xL_x + yL_y = 0

,即

xF_x + yF_y = 0

(常数

m

求偏导后被干掉了)

根据 欧拉定理

kF = 0

,再根据条件

g = m

kF = 0

可以进一步化简为

f = -\lambda m

因此考虑

f

的最值问题,就化为考虑

-\lambda m

的最值问题

理论铺垫多说无益,我们直接来一道实战题目进行讲解 题选自李林预测卷,我是在群里找来的到的

【例】求中心在坐标原点的椭圆

x^2 - 4xy + 5y^2 = 1

的长半轴和短半轴长度

【解】椭圆长/短半轴长度就是椭圆上离中心点最 远/近 的距离长度

故可以目标函数就是

\sqrt{x^2 + y^2}

,但为了化简计算,不妨设目标函数为

x^2 + y^2

构造拉格朗日乘数法:

L(x,y,\lambda) = x^2 + y^2 + \lambda(x^2 - 4xy + 5y^2 - 1)
[ \begin{cases} L_x = 2x + 2\lambda x - 4\lambda y \xlongequal{\text{令}} 0 \\ L_y = 2y + 10\lambda y - 4\lambda x \xlongequal{\text{令}} 0 \\ L_\lambda = x^2 - 4xy + 5y^2 - 1 \xlongequal{\text{令}} 0 \end{cases} ]

考虑使用齐次型化简转化研究对象,让

xL_x + yL_y

[ 2(x^2 + y^2) + 2\lambda (x^2 - 4xy + 5y^2) = 0 ]

由于已知约束条件

x^2 - 4xy + 5y^2 = 1

,故直接代入上式得:

[ x^2 + y^2 = -\lambda ]

x^2 + y^2

最值的问题,成功转化为求

-\lambda

最值的问题了

由于

(x,y) \ne (0,0)

否则肯定不满足第三个方程

L_\lambda(0,0) = -1 \ne 0

故一、二两个方程

L_x

L_y

一定含有 非零解,故他们的 系数矩阵行列式 =

0

[ \begin{vmatrix} 2+2\lambda & -4\lambda \\ -4\lambda & 2 + 10\lambda \end{vmatrix} = 4\lambda^2 + 24\lambda + 4 = 0 \quad\Rightarrow\quad \lambda = -3 \pm 2\sqrt{2} ]

由此可知

x^2 + y^2

的最大值为

3 + 2\sqrt{2}

,最小值为

3 - 2\sqrt{2}

对应到

d = \sqrt{x^2 + y^2}

d_{min} = \sqrt{2} - 1

d_{max} = \sqrt{2} + 1

利用二次型求解

根据 线性代数 知识我们知道,二次型 化成 标准型,可以通过 正交变换 实现

正交变换 有一个非常好的性质:保向量 模长 相等

这样就能利用该 性质,把原有的 约束条件,运用到新坐标下,产生新的 约束条件

适用的题型要求:

  1. 目标函数
f(x_1,x_2,x_3)

是二次型

  1. 约束条件
g

只含有平方项,形如

x_1^2+x_2^2+x_3^2 = m

这样,我们最终要找的 目标函数 最值,就分别是该 二次型矩阵最大最小特征值

上述为直接结论,我会在下面这道例题中详细讲解原理

【例】求

f(x_1,x_2,x_3)=x_1^2+x_2^2+3x_3^2-2x_1x_2

在约束条件

x_1^2+x_2^2+x_3^2=1

上的最值

【解】目标函数二次型,且 约束条件平方和,考虑使用 二次型 计算

二次型

f

对应的矩阵

A = \begin{pmatrix} 1 & -1 & 0 \\ -1& 1 & 0 \\ 0 & 0 & 3 \end{pmatrix}

求出

A

特征值,令

|A - \lambda E| =0
[ \begin{vmatrix} 1-\lambda & -1 & 0 \\ -1& 1-\lambda & 0 \\ 0 & 0 & 3-\lambda \end{vmatrix} = - (\lambda - 3) \cdot \lambda \cdot (\lambda - 2) ]

故可得特征值:

\lambda_1 = 0, \lambda_2 = 2, \lambda_3 = 3
\lambda = 0

时:

(A - 0 \cdot E) \rightarrow \begin{pmatrix} 1 & -1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix} \quad\Rightarrow\quad \xi_1 = \begin{pmatrix} 1\\ 1\\ 0 \end{pmatrix} \quad\Rightarrow\quad e_1 = \dfrac{1}{\sqrt{2}}\begin{pmatrix} 1\\ 1\\ 0 \end{pmatrix}
\lambda = 2

时:

(A - 2 \cdot E) \rightarrow \begin{pmatrix} 1 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix} \quad\Rightarrow\quad \xi_2 = \begin{pmatrix} -1\\ 1\\ 0 \end{pmatrix} \quad\Rightarrow\quad e_1 = \dfrac{1}{\sqrt{2}}\begin{pmatrix} -1\\ 1\\ 0 \end{pmatrix}
\lambda = 3

时:

(A - 3 \cdot E) \rightarrow \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{pmatrix} \quad\Rightarrow\quad \xi_3 = \begin{pmatrix} 0\\ 0\\ 1 \end{pmatrix} \quad\Rightarrow\quad e_3 = \begin{pmatrix} 0\\ 0\\ 1 \end{pmatrix}

故存在 正交矩阵

Q = (e_1,e_2,e_3), s.t. Q^TAQ = \Lambda = \begin{pmatrix} 0 & & \\ & 2 & \\ & & 3 \end{pmatrix}

故存在 正交变换

x = Q y, s.t. f(y_1,y_2,y_3) = 2y_2^2 + 3y_3^2

由于 正交变换 是保向量模长的,故

||x|| = ||y|| \Rightarrow y_1^2 + y_2^2 + y_3^2 = x_1^2 + x_2^2 + x_3^2 = 1

故原命题就等价于:目标函数

f(y_1,y_2,y_3) = 2y_2^2 + 3y_3^2

约束条件

y_1^2 + y_2^2 + y_3^2 = 1

下的最值问题

因此,

f

最大值就是把全部模长分给系数最大分量最小值就是分给系数最小分量

即我在开头说过的,最大最小特征值

f_{min} = 0, f_{max} = 3

利用常见不等式求解

这里不会使用额外其他的不等式,我只介绍考研中常用的 均值不等式柯西不等式

柯西不等式:

[ (a_1^2+a_2^2+\cdots+a_n^2) \times (b_1^2+b_2^2+\cdots+b_n^2) \ge (a_1b_1+a_2b_2+\cdots+a_nb_n)^2 ]

当且仅当

\dfrac{a_1}{b_1} = \dfrac{a_2}{b_2} = \dots = \dfrac{a_n}{b_n}

时,等号成立

均值不等式:

[ \dfrac{a_1^2 + a_2^2 + \cdots + a_n^2}{n} \ge \sqrt[n]{a_1 \cdot a_2 \cdots a_n} ]

当且仅当

a_1 = a_2 = \cdots = a_n

时,等号成立

柯西不等式 建立的是 多项平方和

\ge

多项和 的不等式

均值不等式 建立的是 多项平方和

\ge

多项积 的不等式

一个是 平方和,一个是 平方和,这是我们考虑使用不等式时,首先要考虑的问题

【2018年19题】将

2m

的铁丝分成三段,依次围城圆、正方形、正三角形。三个图形的面积之和是否存在最小值?若存在,求出最小值。

【解】令铁丝分给三个图形的长度分别为

a ,b, c

,则

a + b + c = 2

通过已知周长分别计算出三个图形的面积,应为:

\dfrac{a^2}{4\pi}, \dfrac{b^2}{16}, \dfrac{c^2}{12\sqrt{3}}

S = \dfrac{a^2}{4\pi}+ \dfrac{b^2}{16}+ \dfrac{c^2}{12\sqrt{3}}

原命题就等价于,目标函数

S(a,b,c)

,在 约束条件

a + b + c = 2

下的最小值

目标函数是 多项平方和,约束条件是 多项和,考虑选用 柯西不等式 放缩

构造柯西不等式:

[ \begin{aligned} \bigg[(\dfrac{a}{2\sqrt{\pi}})^2 + (\dfrac{b}{4})^2 + (\dfrac{c}{\sqrt{12\sqrt{3}}})^2\bigg] \cdot \bigg[(2\sqrt{\pi})^2 + 4^2 + (\sqrt{12\sqrt{3}})^2\bigg] &\ge (a + b + c)^2 \\ S \cdot \bigg[4\pi + 16 + 12\sqrt{3}\bigg] &\ge 4 \\ \dfrac{4}{4\pi + 16 + 12\sqrt{3}} &\le S \\ \dfrac{1}{\pi + 4 + 3\sqrt{3}} &\le S \end{aligned} ]

S_{min} = \dfrac{1}{\pi + 4 + 3\sqrt{3}}

,当且仅当

\dfrac{a}{4\pi} = \dfrac{b}{16} = \dfrac{c}{12\sqrt{3}}

时等号成立

【2021年数一】设

x,y,z

,满足

\begin{cases} x^2 + 2y^2-z = 6 \\ 4x + 2y + z = 30 \end{cases}

,求

z

的取值范围

【解】目标函数

z

约束条件

\begin{cases} x^2 + 2y^2 = z + 6 \\ 4x + 2y = 30 - z \end{cases}
  1. 式左侧是 多项平方和,(2) 式左侧式 多项和 考虑 柯西不等式 放缩

构造 柯西不等式

[ \begin{aligned} (x^2 + (\sqrt{2} y)^2) \cdot (4^2 + (\sqrt{2})^2) &\ge (4x + 2y)^2 \\ (z + 6) \cdot 18 &\ge (30 - z)^2 \\ z^2 - 78z + 792 &\le 0 \\ (z - 12)(z - 66) &\le 0 \\ \end{aligned} ]

z\in[12, 66]
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021-11-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 无条件极值
  • 条件极值
    • 利用轮换对称式化简拉格朗日乘子
      • 三角换元法
        • 利用齐次式化简拉格朗日乘子
          • 利用二次型求解
            • 利用常见不等式求解
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档