前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >常见不等式考察(一)——Jensen不等式

常见不等式考察(一)——Jensen不等式

作者头像
codename_cys
发布2021-09-26 15:32:25
1.3K0
发布2021-09-26 15:32:25
举报
文章被收录于专栏:我的充电站我的充电站

0. 引言

这两天在看文献的时候,突然注意到文献中使用了Jensen不等式,然后猛地发现似乎太久不看这些东西,都已经忘得差不多了,是时候得好好复习一下这些东西了……

1. Jensen不等式定义

Jensen不等式是针对凸函数的一个常用的不等式,其定义如下:

f ( λ ⋅ x 1 + ( 1 − λ ) ⋅ x 2 ) ≤ λ ⋅ f ( x 1 ) + ( 1 − λ ) ⋅ f ( x 2 ) f(\lambda \cdot x_1 + (1-\lambda)\cdot x_2) \leq \lambda \cdot f(x_1) + (1-\lambda)\cdot f(x_2) f(λ⋅x1​+(1−λ)⋅x2​)≤λ⋅f(x1​)+(1−λ)⋅f(x2​)

https://ccjou.files.wordpress.com/2013/08/convex-function.gif
https://ccjou.files.wordpress.com/2013/08/convex-function.gif

上述不等式可以由凸函数的定义快速地得到,我们可以将其推广至一般的情况,即下述表达式:

f ( ∑ i = 1 n λ i x i ) ≤ ∑ i = 1 n λ i f ( x i ) f(\sum_{i=1}^{n} \lambda_i x_i) \leq \sum_{i=1}^{n} \lambda_i f(x_i) f(i=1∑n​λi​xi​)≤i=1∑n​λi​f(xi​)

其中, ∑ i = 1 n λ i = 1 \sum_{i=1}^{n} \lambda_i = 1 ∑i=1n​λi​=1。

而如果函数为严格的凹函数,则上述Jensen不等式同样可以成立,但是符号需要反向,即修改为:

f ( ∑ i = 1 n λ i x i ) ≥ ∑ i = 1 n λ i f ( x i ) f(\sum_{i=1}^{n} \lambda_i x_i) \geq \sum_{i=1}^{n} \lambda_i f(x_i) f(i=1∑n​λi​xi​)≥i=1∑n​λi​f(xi​)

2. Jensen不等式证明

关于Jensen不等式的证明方法,其实网上已经有了不少的解答,不过基本都是基于数学归纳法的解答。

这里,我们来仿照网上的一些解法来自行进行一下推导。

显然,对于 n ≤ 2 n \leq 2 n≤2的情况,又凸函数的定义,上述不等式是易得的。

下面,我们假设在 n = k n=k n=k的情况下,不等式成立,则我们考虑 n = k + 1 n = k+1 n=k+1时的情况。

f ( ∑ i = 1 k + 1 λ i ⋅ x i ) = f ( ∑ i = 1 k λ i ⋅ x i + λ k + 1 ⋅ x k + 1 ) = f ( ( 1 − λ k + 1 ) ⋅ ( ∑ i = 1 k λ i 1 − λ k + 1 ⋅ x i ) + λ k + 1 ⋅ x k + 1 ) ≤ ( 1 − λ k + 1 ) ⋅ f ( ∑ i = 1 k λ i 1 − λ k + 1 ⋅ x i ) + λ k + 1 ⋅ f ( x k + 1 ) ≤ ( 1 − λ k + 1 ) ⋅ ( ∑ i = 1 k λ i 1 − λ k + 1 ⋅ f ( x i ) ) + λ k + 1 ⋅ f ( x k + 1 ) = ∑ i = 1 k λ i ⋅ f ( x i ) + λ k + 1 ⋅ f ( x k + 1 ) = ∑ i = 1 k + 1 λ i ⋅ f ( x i ) \begin{aligned} f(\sum_{i=1}^{k+1} \lambda_i \cdot x_i) & = f(\sum_{i=1}^{k} \lambda_i \cdot x_i + \lambda_{k+1} \cdot x_{k+1}) \\ & = f((1-\lambda_{k+1})\cdot (\sum_{i=1}^{k} \frac{\lambda_i}{1-\lambda_{k+1}} \cdot x_i) + \lambda_{k+1} \cdot x_{k+1}) \\ & \leq (1-\lambda_{k+1})\cdot f(\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}} \cdot x_i) + \lambda_{k+1} \cdot f(x_{k+1}) \\ & \leq (1-\lambda_{k+1}) \cdot (\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}} \cdot f(x_i)) + \lambda_{k+1} \cdot f(x_{k+1}) \\ & = \sum_{i=1}^{k} \lambda_i \cdot f(x_i) + \lambda_{k+1} \cdot f(x_{k+1}) \\ & = \sum_{i=1}^{k+1} \lambda_i \cdot f(x_i) \end{aligned} f(i=1∑k+1​λi​⋅xi​)​=f(i=1∑k​λi​⋅xi​+λk+1​⋅xk+1​)=f((1−λk+1​)⋅(i=1∑k​1−λk+1​λi​​⋅xi​)+λk+1​⋅xk+1​)≤(1−λk+1​)⋅f(i=1∑k​1−λk+1​λi​​⋅xi​)+λk+1​⋅f(xk+1​)≤(1−λk+1​)⋅(i=1∑k​1−λk+1​λi​​⋅f(xi​))+λk+1​⋅f(xk+1​)=i=1∑k​λi​⋅f(xi​)+λk+1​⋅f(xk+1​)=i=1∑k+1​λi​⋅f(xi​)​

由此可见,不等式成立。

综上,一般情况下的Jensen不等式即可证明完毕。

而同理,对于凹函数情况下的Jensen不等式,我们只需要完全仿照上述的解法即可证明。

3. Jensen不等式的常见形式

下面,我们来看一下Jensen不等式在不同场景下的一些引申表达方式以及应用。

1. 具体凸函数下的Jesen不等式

1. 幂函数

对于幂函数 f ( x ) = x k f(x) = x^k f(x)=xk,我们有:

( ∑ i = 1 n λ i ⋅ x i ) k ≤ ∑ i = 1 n λ i ⋅ x i k (\sum_{i=1}^{n} \lambda_i \cdot x_i)^k \leq \sum_{i=1}^{n}\lambda_i \cdot x_i^k (i=1∑n​λi​⋅xi​)k≤i=1∑n​λi​⋅xik​

特别的,当所有的系数都相同时,我们即有:

( ∑ i = 1 n x i n ) k ≤ ∑ i = 1 n x i k n (\frac{\sum_{i=1}^{n} x_i}{n})^k \leq \frac{\sum_{i=1}^{n}x_i^k}{n} (n∑i=1n​xi​​)k≤n∑i=1n​xik​​

2. 对数函数

对于对数函数,我们可以写出对应的Jensen不等式如下:

l o g ( ∑ i = 1 n λ i ⋅ x i ) ≤ ∑ i = 1 n λ i ⋅ l o g ( x i ) log(\sum_{i=1}^{n} \lambda_i \cdot x_i) \leq \sum_{i=1}^{n} \lambda_i \cdot log(x_i) log(i=1∑n​λi​⋅xi​)≤i=1∑n​λi​⋅log(xi​)

特别地,当所有的系数都相同时,即有:

l o g ( ∑ i = 1 n x i n ) ≤ 1 n ⋅ ∑ i = 1 n l o g ( x i ) log(\frac{\sum_{i=1}^{n}x_i}{n}) \leq \frac{1}{n} \cdot \sum_{i=1}^{n} log(x_i) log(n∑i=1n​xi​​)≤n1​⋅i=1∑n​log(xi​)

3. 指数函数

对于指数函数,我们可以写出对应的Jensen不等式如下:

e x p ( ∑ i = 1 n λ i ⋅ x i ) ≤ ∑ i = 1 n λ i ⋅ e x i exp(\sum_{i=1}^{n} \lambda_i \cdot x_i) \leq \sum_{i=1}^{n} \lambda_i \cdot e^{x_i} exp(i=1∑n​λi​⋅xi​)≤i=1∑n​λi​⋅exi​

特别地,当所有的系数都相同时,即有:

e x p ( ∑ i = 1 n x i n ) ≤ 1 n ⋅ ∑ i = 1 n e x i exp(\frac{\sum_{i=1}^{n}x_i}{n}) \leq \frac{1}{n} \cdot \sum_{i=1}^{n} e^{x_i} exp(n∑i=1n​xi​​)≤n1​⋅i=1∑n​exi​

4. 三角函数

对于三角函数(我们以 s i n sin sin为例,其在 [ 0 , π ] [0, \pi] [0,π]范围内为凹函数),我们可以写出对应的Jensen不等式如下:

s i n ( ∑ i = 1 n λ i ⋅ θ i ) ≥ ∑ i = 1 n λ i ⋅ s i n θ i sin(\sum_{i=1}^{n} \lambda_i \cdot \theta_i) \geq \sum_{i=1}^{n} \lambda_i \cdot sin\theta_i sin(i=1∑n​λi​⋅θi​)≥i=1∑n​λi​⋅sinθi​

特别地,当所有的系数都相同时,即有:

s i n ( ∑ i = 1 n θ i n ) ≥ 1 n ⋅ ∑ i = 1 n s i n θ i sin(\frac{\sum_{i=1}^{n}\theta_i}{n}) \geq \frac{1}{n} \cdot \sum_{i=1}^{n} sin\theta_i sin(n∑i=1n​θi​​)≥n1​⋅i=1∑n​sinθi​

特别的,对于三角形的三个内角,我们有:

1 3 ( s i n A + s i n B + s i n C ) ≤ s i n ( π 3 ) \frac{1}{3}(sinA + sinB + sinC) \leq sin(\frac{\pi}{3}) 31​(sinA+sinB+sinC)≤sin(3π​)

即:

s i n A + s i n B + s i n C ≤ 3 3 2 sinA + sinB + sinC \leq \frac{3\sqrt{3}}{2} sinA+sinB+sinC≤233 ​​

2. 连续形式下的Jensen不等式

已知 g ( x ) > 0 g(x) > 0 g(x)>0, ∫ x g ( x ) d x = 1 \int_{x}g(x)dx = 1 ∫x​g(x)dx=1,且函数 f ( x ) f(x) f(x)为凸函数,则有:

f ( ∫ x g ( x ) ⋅ x d x ) ≤ ∫ x g ( x ) ⋅ f ( x ) d x f(\int_x g(x) \cdot x dx) \leq \int_x g(x) \cdot f(x) dx f(∫x​g(x)⋅xdx)≤∫x​g(x)⋅f(x)dx

3. 概率论中的Jensen不等式

特别的,我们将上述2中的连续形式下的 g ( x ) g(x) g(x)函数表示为概率分布函数,那么我们就可以很简单地导出概率论当中常见的Jensen不等式的表达式:

f ( E ˉ ( x ) ) ≤ E ˉ ( f ( x ) ) f(\bar{E}(x)) \leq \bar{E}(f(x)) f(Eˉ(x))≤Eˉ(f(x))

4. 参考链接

  1. https://en.wikipedia.org/wiki/Jensen%27s_inequality
  2. https://zhuanlan.zhihu.com/p/39315786
  3. https://zhuanlan.zhihu.com/p/279442299
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-09-21 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 0. 引言
  • 1. Jensen不等式定义
  • 2. Jensen不等式证明
  • 3. Jensen不等式的常见形式
    • 1. 具体凸函数下的Jesen不等式
      • 1. 幂函数
      • 2. 对数函数
      • 3. 指数函数
      • 4. 三角函数
    • 2. 连续形式下的Jensen不等式
      • 3. 概率论中的Jensen不等式
      • 4. 参考链接
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档