设 A 为 m×n 实矩阵,b 是 m 维实向量且 b∈R(A) . 证明系统 x>0,Ax=b 有解的充要条件是系统
ATλ⩾0,ATλ=0,bTλ⩽0
无解.
证明:先证明如下命题:
所有满足 Ax=b 的 x 都有 cTx=d 的充要条件是:存在向量 λ 使得 c=ATλ,d=bTλ .
命题充分性:由于 c=ATλ 存在 λ 使其成立,则对满足 Ax=b 的 x 有:
d=(Ax)Tλ=xTATλ=xTc=cTx
这说明充分性成立.
命题必要性:对 Ax=b ,如果不存在 x ,则命题前提不能成立,取使得 Ax=b 的 x ,则对方程组 c=ATλ ,有
xTc=xTATλ=bTλ=d
因此命题中有关 λ 的向量如果有解,则同时有解.
下面说明 c=ATλ 当中 λ 的存在性,Ax=b 有解且设矩阵 A 的秩满足 r=rank(A),设矩阵 F∈Rn×(n−r) 满足
R(F)=N(A)
令 x0 为 Ax=b 的解,那么 x 满足 Ax=b 当且仅当存在 y 使得
x=Fy+x0
即 x 可以 x0 作为特解,那么有
cTx=cTFy+cTx0=d
那么 cTFy=0 ,且 y 可以取 Rn−r 当中的任意向量,于是 FTc=0 必须成立. 而考虑到 R(AT)=N(FT) . 于是
ATλ=c
有解. 因此结论成立.
再利用上述命题证明本题.
必要性:假设 ATλ⩾0,ATλ=0,bTλ⩽0 有解,那么令 ATλ=c⩾0 ,bTλ=d⩽0 ,则根据引理, cTx=d . 但是 x>0 ,这就在正负性上出现了矛盾.
充分性:根据 b∈R(A) ,说明 Ax=b 有解,如果 x>0,Ax=b 无解,说明对 Ax=b 的解 x0 必有分量 ⩽0 ,考虑构造 d=0∈Rn ,从 cTx0=0 解出 cT⩾0,cT=0 ,则根据引理,存在 λ 使得
c=ATλ⩾0,bTλ=0⩾0
这就出现了矛盾. 于是 x>0,Ax=b 有解. □
设 f(x):Rn→R1 和 φ(t):R1→R1 都是凸函数,φ(t) 还是单增函数,证明复合函数 h(x)=φ(f(x)) 是凸函数.
证明:首先 f 是凸函数且 φ 单增,因此:
h(λx1+(1−λ)x2)=φ(f(λx1+(1−λ)x2))⩽φ(λf(x1)+(1−λ)f(x2))
然后考虑设 y1=f(x1),y2=f(x2) . 因此
=φ(λy1+(1−λ)y2)⩽λφ(y1)+(1−λ)φ(y2)
因此
h(λx1+(1−λ)x2)⩽λh(x1)+(1−λ)h(x2)
即 h 是凸函数. □
若函数 ψ:Rn→Rn ,对任意 x,y∈dom(ψ) ,
(ψ(x)−ψ(y))T(x−y)⩾0
都称 ψ 是单调映射,设 f:Rn→R 是可微凸函数,则 ∇f 是单调映射,反过来,每个单调映射都是某个凸函数的梯度,对吗?
证明:我们首先证明前一个命题,若 f 为可微凸函数,则
∇f(x)(y−x)T⩽f(y)−f(x)
同时
∇f(y)(y−x)T⩾f(y)−f(x)
相减可得
(∇f(y)−∇f(x))T(y−x)⩾0
即 ∇f 是单调映射.
反过来不一定成立,在 n=1 时,凸函数的导数由 Darboux 定理可知必须由介值性,但单调函数不一定具有介值性,取一个不连续,没有介值性的单调映射即可. □
设
q(x)=21xTBx+bTx+c
其中 B∈Rn×n 为对称矩阵,b∈Rn,c∈R ,证明 q(x) 有唯一极小点的充分必要条件是矩阵 B 正定.
证明:设 B=(bij) 以及 b=(β1,⋯,βn)T,那么
q(x)=21i=1∑nj=1∑nbijxixj+i=1∑nβixi+c
先对 xm 求导:
∂xm∂q(x)=βm+bmmxm+i=1,i=m∑nbmixi+j=1,j=m∑nbimxj
再对 xk 求导
∂xk∂(∂xm∂q(x))=bmk=bkm
于是 B 即为 q(x) 的 Hesse 矩阵.
对于充分性,B 正定说明只有在 x=0 时 q(x) 的 Hesse 矩阵才为零矩阵,从而 0 是唯一极小点.
对于必要性,q(x) 仅有一个唯一极小点,说明在极小点之外的其它地方 Hesse 矩阵均大于 0 ,也就是 B>0 . □
设 f:R→R 是凸函数,a<b :
- 证明:
f(x)⩽b−ab−xf(a)+b−ax−af(b),∀x∈[a,b]
- 证明
x−af(x)−f(a)⩽b−af(b)−f(a)⩽b−xf(b)−f(x),∀x∈[a,b]
- 设 f 是可微的,由 2 证明
f′(a)⩽b−af(b)−f(a)⩽f′(b)
- 设 f 是二次可微的,由 3 证明 f′′(a)⩾0,f′′(b)⩾0 .
证明:
(1) 设
λ=b−ab−x
于是根据凸函数定义:
f(x)=f(λa+(1−λ)b)⩽λf(a)+(1−λ)f(b)
即题中不等式.
(2) 将 (1) 中不等式转化为
(b−a)f(x)⩽(b−x)f(a)+(x−a)f(b)
两侧减去 (b−a)f(a) ,那么有
(b−a)[f(x)−f(a)]⩽(x−a)[f(b)−f(a)]
这就得到了第一个不等号. 两侧减去 (b−a)f(b) 可得
(b−a)[f(x)−f(b)]⩽(b−x)[f(a)−f(b)]
因此题中不等式成立.
(3) 第一个不等号由 (2) 不等式,令 x↓a ,可得
f′(a)=f′(a+0)⩽b−af(b)−f(a)
令 x↑b 可得
b−af(b)−f(a)⩽f′(b−0)=f′(b)
(4) (3) 说明对于任意的 a<b 都有 f′(a)⩽f′(b) ,这就说明
f′′(a)=b→alimb−af′(b)−f′(a)⩾0
对 f′(b)⩾0 证明同理. □
证明函数
f(x)=−(i=1∏nxi)n1
在 R+n 中是凸函数.
证明:考虑
−f(λx+(1−λ)y)=(i=1∏n(λxi+(1−λ)yi))n1
以及
−λf(x)−(1−λ)f(y)=λ(i=1∏nxi)n1+(1−λ)(i=1∏nyi)n1
之间的大小关系,注意到
λ(i=1∏nxi)n1+(1−λ)(i=1∏nyi)n1=(i=1∏nλxi)n1+(i=1∏n(1−λ)yi)n1⩽i=1∏n(λn1xin1+(1−λ)n1yin1)⩽(i=1∏n(λxi+(1−λ)yi))n1
从而
−λf(x)−(1−λ)f(y)⩽−f(λx+(1−λ)y)
即 f(x) 是凸函数. □