拉格朗日对偶问题

为为为什么

发布于 2022-08-05 14:19:45

8000

发布于 2022-08-05 14:19:45

文章被收录于专栏：又见苍岚又见苍岚

在前文了解过拉格朗日乘数法后，进一步介绍拉格朗日对偶。

背景信息

在约束最优化问题中，常常利用拉格朗日对偶性（Lagrange duality）将原始问题转换为对偶问题，通过解对偶问题而得到原始问题的解。

拉格朗日对偶是在拉格朗日乘数法基础之上，通过变换原始问题的求解形式得到的相对于原始优化问题的另一个优化问题

原始优化问题

假设f(x) , c_i(x) , h_j(x) 是定义在\mathbf{R}^{n} 上的连续可微函数，考虑约束最优化问题：

定义此问题为原始优化问题

广义拉格朗日函数

来源见：拉格朗日乘数法

L(x, \alpha, \beta)=f(x)+\sum_{i=1}^{k} \alpha_{i} h_{i}(x)+\sum_{j=1}^{l} \beta_{j} g_{j}(x)\tag{2} \label{eq2}

其中 x=\left(x_1, x_2, \ldots, x_n\right)^{T} \in \mathbf{R}^{n} , \alpha_{i}, \beta_{j} 是拉格朗日乘子，且\alpha_{i} \geq 0

拉格朗日对偶的来源

考虑原始优化问题\eqref{eq1}

想要求得f(x) 的最小值，也就是要求f(x) 的最大下界
对于方程组：

若方程组\eqref{eq3} 无解，则v 是f(x) 的一个下界，也就是说如果有渠道可以利用到方程组\eqref{eq3} 无解，则可以利用其限制f(x) 的下界
注意到若方程组\eqref{eq3} 有解，可以推出对于任意\lambda \ge 0 ：

f(\mathbf{x})+\sum_{i=1}^{k} \lambda_{i} h_{i}(\mathbf{x})<v \tag{4} \label{eq4}

方程\eqref{eq4} 有解
即命题：if 方程组\eqref{eq3} 有解 then 方程\eqref{eq4} 有解成立
则其逆否命题 **if 方程\eqref{eq4} 无解 then 方程组\eqref{eq3} 无解 ** 成立
而方程\eqref{eq4} 无解的充要（等价）条件是：

方程\eqref{eq5} 的自变量为\lambda_i ，我们的目标是要找到其上界v_{max} ，因此有：

方程\eqref{eq6} 即为拉格朗日对偶问题的核心，延续原始问题的标记，记为：

可以说对偶问题就是从另一个方向逼近f(x) 最小值的问题

对偶问题的性质

之所以引入另一个优化问题是因为对偶问题之间有着良好的性质

对偶问题的对偶是原问题；
无论原始问题是否是凸的，对偶问题都是凸优化问题；
对偶问题可以给出原始问题一个下界；
当满足一定条件时，原始问题与对偶问题的解是完全等价的；

拉格朗日对偶问题的凹函数性质证明

按照定义

对偶问题有一个很好的性质是对偶函数为凹函数，证明如下

命题 拉格朗日对偶函数一定是凹函数，且其凹性与最优化函数和约束函数无关。
考虑对偶问题\eqref{eq7} ，按照凹函数定义，往证：

D(\theta {\alpha _1} + (1 - \theta ){\alpha _2},\theta {\beta _1} + (1 - \theta ){\beta _2}) \ge \theta D({\alpha _1},{\beta _1}) + (1 - \theta )D({\alpha _2},{\beta _2}) \tag{8} \label{eq8}

有：

其中\eqref{eq9} 的不等式来源于：
对于实数集合\bf{a},\bf{b} ：

对于任意i ，有：

原命题得证。

仿射函数

另一种思路是讨论\eqref{eq2} 的后两项内容

因为对偶问题中x 视作常数，\alpha,\beta 为自变量，可以视作：

因此D(\alpha, \beta) 是调整常数A,B,C 的仿射函数，仿射函数既凸且凹，因此拉格朗日对偶问题具有凹函数性质

拉格朗日对偶

原始问题

考虑x 的函数：

这里，P 表示原始问题。将上式看做x 的函数。等式右边可以看做固定x 的情况下，求关于\alpha, \beta 的函数 L 的最大值的问题。

可以推出：

考虑极小化问题：

\min _{x} P(x)=\min _{x} \max _{\alpha, \beta ; \alpha \geq 0} L(x, \alpha, \beta) \tag{15} \label{eq15}

式\eqref{eq15} 与\eqref{eq7} 等价，因为固定x 时剩余两项在约束范围内最大值为0，相当于在约束范围内求解f(x) 的最小值。
定义原始问题的值为：

p^{*}=\min _{x} P(x) \tag{16}

对偶问题

延续上文的对偶问题\eqref{eq7}
可以看到事实上对偶问题与原问题为极大极小的求解顺序问题
定义对偶问题的值：

原始问题与对偶问题的关系

对偶问题的解不大于原始问题的解：
证明：

该性质为弱对偶性（weak duality），该性质在任何情况下都成立
也因为弱对偶的存在，使得 对偶问题可以给出原始问题的下界
与弱对偶性相对应的是强对偶性（strong duality），即：

d^{* } = p^{* } \tag{19}

若强对偶性成立，即原始问题与对偶问题的最优值相等，则可以通过求解对偶问题来得到原始问题的解

强对偶成立条件

强对偶的性质太过于美妙，如果我们的问题满足强对偶条件，直接求对偶问题就好了这里列出两个常见的条件

Convex + Slater

原问题是凸优化 f(x) 和h(x) 是凸函数 g(x) 是放射函数
存在x 使得不等式约束严格成立（严格成立不等号）

KKT 条件

原问题是否为凸函数的两种情况下，KKT的用法不同

原问题非凸

当原问题并非凸优化(或者不清楚、不关心是不是凸优化)时，KKT 条件是一种用来描述强对偶情况下最优解性质的条件换而言之，若强对偶性质成立，那么满足最优解的点一定满足 KKT 条件；KKT 条件是强对偶一个必要条件，但无法作为充分条件来使用

原问题为凸函数

当原问题为凸优化时，KKT 条件在非凸的基础上有多了找到最优点的功能在这种情况下，那么满足 KKT 条件的点一定是原问题和对偶问题的最优解；KKT 条件成了强对偶和最优解的充要条件

参考资料

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2021年3月19日，如有侵权请联系 cloudcommunity@tencent.com 删除

https

网络安全

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

https

网络安全

登录后参与评论

0 条评论

热度