因为我在实际中需要用到次梯度的一些性质,这里对次梯度的概念做一个整理,以下是对书<<最优化:建模、算法与理论>>(刘浩洋、户将、李勇锋、文再文编著)中关于次梯度的一些记录笔记。
2.7.1 次梯度的定义
定义 2.21 (次梯度)
g为函数f在点x处的一个次梯度
f(y)≥f(x)+gT(y−x),∀y∈domf.
定理 2.16 (次梯度存在性)
设f为凸函数,dom f 为其定义域.如果 x ∈ intdom f,则 ∂f(x) 是非空的,其中intdom f的含义是集合 dom f的所有内点.
例 2.15 (l2 范数的次微分)
2.7.2 次梯度的性质
定理 2.17 设 f 是凸函数,则 ∂f(x) 有如下性质:
(1) 对任何 x ∈ dom f ,∂ f (x) 是一个闭凸集(可能为空集);
(2) 如果 x ∈ intdom f,则 ∂f(x) 非空有界集.
6.3 次梯度算法
xk+1=xk−αkgk,gk∈∂f(xk), αk>0为步长.
- 固定步长 αk=α.
- 固定∥xk+1−xk∥, 即αk∥gk∥为常数.
- 消失步长αk→0 且 ∑k=0∞αk=+∞
- 选取αk使其满足某种线搜索准则.
相比可微凸函数的梯度的一阶条件,次梯度显然不能用这个一阶条件作为算法的停机条件。
6.3.2 收敛性分析
假设6.1 对无约束优化问题,目标函数f(x)满足:
- f为凸函数
- f至少存在一个有限的极小值点 x∗, 且f(x∗)>−∞;
- f为利普希茨连续的,即∣f(x)−f(y)∣≤G∥x−y∥,∀x,y∈Rn, G为利普希茨常数.
引理6.2 f为利普希茨连续的,当且仅当f的次梯度有界.
不同步长下的收敛性
定理 6.5 (次梯度算法的收敛性)