最优化方法 - 导论、凸集、最佳逼近
最优化方法研究导论
基本概念
最优化方法通俗地来说就是研究如下类型优化问题的学科:
其中 表示 subject to,上式包含了我们研究最优化的三个对象:
- 决策变量:指决策者为实现规划目标的方案,措施,是问题中要确定的未知量.
- 目标函数:指问题要达到的目的要求,表示为决策变量的函数.
- 约束条件:指决策变量取值时受到的各种可用资源的限制,表示为含决策变量的等式或不等式.
这里面 又叫可行域,一般而言可以表示成如下的形式:
也就是说,约束条件可以表述为 或 的形式.
约束条件的更改
运筹学当中,我们曾学到线性规划的标准形式,其约束条件可以都表示为 ,我们是否也能用增加松弛变量的方式来进行变换?
在最优化方法中,我们实际上遇到的不止会是运筹学当中遇到的线性规划问题,这些优化问题往往会需要函数的可微性,但是松弛变量会影响可微性.
为什么呢?我们不妨来看一种增加松弛变量的方法,考虑 无约束,那么我们的增加松弛变量的方法就是:
但是绝对值是不可微的,这就会出现问题.
优化问题类型
定义:无约束优化问题、有约束优化问题
如果优化问题当中没有约束条件,则称为无约束优化问题,否则称为有约束优化问题.
在之后我们将会逐个讨论.
可行解、最优解
定义:可行域、可行点
记
称 为问题的可行域, 中任意一点称为可行点.
定义:整体最优解,严格整体最优解
一个点 称为问题的整体最优解,若
若不等式严格成立,则称 为严格整体最优解. 若对 的一个邻域 有
则称 为问题的局部最优解.
最优解将会是我们之后求解的目标.
凸集及其性质
凸集和凸包
定义:凸集
称一个集合 为凸集,如果对于任意的 以及 ,都有
这个概念在数学分析当中就已经阐述了,但是在最优化理论当中,凸集的性质是相当好的,我们之后的理论将会围绕凸集和凸函数进行.
定义:凸组合
设 是 中的 个点,称 为 的凸组合,这里 ,且 .
凸组合是线段的一个推广,给定 个点,其凸组合的全体构成的集合就是这些点构成的凸包(见下文).
定义:凸包
设 ,称下列集合
即 中任意有限个点的凸组合全体为 的凸包.
凸包可以理解为“凸化”,它将一个非凸的集合变为凸集,因此它有一些比较好的性质.
注意其中的一个问题,至少从定义看来,我们只能写成某 个向量的凸组合,而不是可以写成任意长的凸组合.
定理
设 是凸集,则 中任意 个点的凸组合仍属于 .
证明: 考虑归纳法,当 时,根据凸集的定义可知结论成立,假设 时结论成立,那么当 时:
其中 ,对 根据归纳假设可知其为 ,同时最终可得 为两点的凸组合. 因此结论成立.
定理
设 ,则对 中任意点 ,它一定可以表示为 中 个点的凸组合.
证明: 对于 ,我们可以将其表示为 个向量的凸组合:
现在讨论 和 的关系. 注意 并没有默认为凸集,首先讨论 ,这个情况得到结论是显然的,因为可以把系数分拆得到更多的向量,当 时,我们考虑如下所示的向量组:
共 个向量,但 的维数只有 ,上述向量是线性相关的,因此我们可以取其极大无关组,从而将 用更少的凸组合方式表示出来,进而将向量数减少到 及以下.
构造性证明
另一个构造性证明请参考教材.
保凸运算
下列集合运算是保凸的:
- 交集:两个凸集的交还是凸集.
- 仿射函数:经过线性变换之后(伸缩、平移、旋转),凸集还是凸集.
- 线性分式函数或透视函数.
定义:透视函数
透视函数的定义: 其中定义域为 其中 为正实数集.
我们下面证明其保凸性.
定理:透视函数保凸
如果 是凸集,则其透视函数图像 也是凸集.
凸集的分离和支撑
简单回顾
这里我们略去关于邻域、闭包、内部、边界的讨论,这些都在以前说明过. 只强调一下符号:
- 为闭包;
- 为内部;
- 为边界;
- 为补集.
分离超平面定理
定义:分离超平面
设 为两个非空凸集,若存在非零向量 和实数 ,使得
则称超平面 分离了 和 . 如果将上述的不等号改为严格不等号,则称 严格分离了 和 .
这里我们实际上要说明的是:这个超平面是否一定存在?这个结论是肯定的,换句话说:没有交集的两个凸集,可以被一个超平面完全分隔开.
最佳逼近定理
闭凸集的最佳逼近
定理:最佳逼近定理 (凸集)
设 是非空闭凸集, 但 ,则 (1) 存在唯一的点 使得
(2) 是 中离 最近的点的充要条件是:
证明:
(1) 存在性:由于 有可能无界,那么对于连续函数
无法使用最值定理,因此我们考虑以 为球心,任取 ,以 为半径作闭球,设为 ,此时 是闭凸集,因此在 上应用最值定理即可找到 的最小值.
而对于 的部分,这部分的元素和 的距离至少都有 ,因此无需在其中寻找最小值.
唯一性: 假设存在另外一个最佳逼近 ,那么考虑
根据最佳逼近的定义,上述不等号只能取等,而三角不等式的取等条件就是 和 线性相关,即
两侧取范数即可得到 或 ,但 时, ,出现矛盾. 因此只有 ,即 成立.
(2) 充分性:考虑
这就说明了 是离 最近的点.
必要性:对于任意给定的 以及 ,有
所以由最佳逼近的性质有:
那么有
令 可得结论.