Farkas 引理
点与凸集的分离
设 为非空的闭凸集,考虑
为超平面,如果 分离了点 和 ,说明若 ,则 . 换言之,令 ,可以表示
这就是下面定理的思想来源.
定理:点与凸集分离定理
设 为 中非空闭凸集, ,则存在非零向量 和实数 ,使得
定理证明:根据上节的最佳逼近可得存在唯一的 使得
即
由此可得
记 ,则
那么有
记 即可.
Farkas 引理
定理:Farkas 引理
设 为 矩阵, ,则下列两个不等式系统有且仅有一组有解:
与
证明:假设两个都有解,则
这就出现了矛盾.
现在假设第二个系统无解,不难证明
是凸集,于是 ,因此根据点与凸集分离定理存在 和 使得
于是
这对任何一个 都成立,这说明 是必须的,若存在某个分量为正,则令 在该对应位置取到较大正值,可使得取值超过 .
由于 ,因此 ,即有 ,因此 为第一个系统的解.
Farkas 引理的几何意义非常明确,我们这个地方来说明一下为什么它非常直观.
首先我们来讨论第一个系统有解的几何意义:
其中 表示 与 的所有行向量成大于等于直角, 与 成锐角. 第二个系统则是
其中 表示 是 当中列向量,即 中行向量的线性组合,但是其中 表示 必须在凸锥当中.
这里给出如下的解释:如果 当中 ,则 构成一个凸锥,见下图,凸锥的边界由 的列向量决定.
那么 Farkas 引理的几何意义就很明确了,我们看下图,简化到二维情形之后,实质上就是两种情形的讨论:
- 在 行向量组成的凸锥之外;
- 在 行向量组成的凸锥之内(包含边界).
如果 在凸锥外,则为左图, 可以和 的行向量都保持钝角夹角,和 保持锐角. 而对另一个系统,由于不在凸锥内,自然找不到 使得 为 行向量的正线性组合.
如果 在凸锥内,和左图的情况就是相反的.
超平面分离定理
支撑超平面
定义:支撑超平面
设 为非空集合,点 ,若存在 ,使得
D \subseteq H_\overline{x}^{+} = \left\lbrace x\mid a^{\mathrm{T}}(x-\overline{x}) \geqslant 0 \right\rbrace或
则称超平面 是集合 在 处的支撑超平面.
可以知道,凸集一定有支撑超平面,并且在任意的边界点处都有支撑超平面. 这就是我们接下来要证明的一个问题.
定理:凸集一定存在支撑超平面
设 是非空凸集, ,则存在非零向量 使得
这里 表示 的闭包.
证明:由于 ,则存在 使得 且 ,那么根据点与凸集的分离定理有
而 显然有界,因此有收敛子列,不妨设就是本身收敛于 ,则 时
于是结论成立.
根据证明过程,可以发现当 时结论均成立,那么用这个推论可以证明本节几乎最重要的一个定理.
超平面分离定理
定理:超平面分离定理
设 是两个非空凸集,且 ,则存在超平面分离 ,即存在 使得
证明:设
可以知道由于二者不交,有 ,故根据推论
从而
最后对于闭包,只差边界上的极限点,直接利用点列取极限即可.
Farkas 引理和 Gordan 引理及其应用
这里引入 Gordan 引理,我们不按照教材的方法进行证明而是转化为 Farkas 引理的形式利用 Farkas 引理证明.
定理:Gordan 引理
设 为 矩阵,则下列两个不等式系统有且仅有一组有解:
以及
证明:设 有
同时
从而利用 Farkas 引理即可.
这类问题只需要考虑几种可能的情况并转化为 Farkas 引理的形式即可.
第一个系统当中出现 的等式形式.
首先我们要将其变成不等式,也就是
然后考虑其中的 ,如果 那自然很好,如果不是,则考虑
的形式,在 的情况下,此时的如果写在一个不等式里就写为:
第一个系统中出现 的严格不等式.
此时添加松弛变量即可: 使得
第二个系统中出现不等式.
此时将与 的差距设为变量即可,例如 ,则考虑设 ,有
凸函数
凸函数定义
定义:凸函数
设 是定义在凸集 上的函数,如对任意 和 ,有
则称 是 上的凸函数,如上述不等式对 严格成立,则称 是 上的严格凸函数.
需要注意的是,这里所说的“凸”是下凸函数. 除此之外和数学分析定义的无异.
问题
如果 换成某个固定的数,可以吗?
不可以,但是这实际上是一个好问题,因为在 时,有一个专门的概念叫做“中点凸”,这种函数也有一些不错的性质.
凸函数的等价性质
定理:凸函数充要条件:单变量函数
函数 时 上的凸函数的充要条件是对于任意 ,单变量函数 是 的凸函数.
定理:凸函数充要条件:方向导数
设 是凸函数,则对任意 及非零方向 在 点沿方向 的方向导数存在.