$$ ⁍ $$
优化是在空间范围内找到参数,最小化风险,其中 $\Theta$ 为约束条件
给定训练集,经验风险为
$$ ⁍ $$
为了防止过拟合,增强模型的泛化性,提出结构风险
$$ ⁍ $$
称一个集合 $\mathcal{X}$ 是凸集(convex set),若 $\forall a,b \in \mathcal{X}, \forall \lambda\in [0, 1], \lambda a + (1-\lambda)b\in\mathcal{X}$
<aside> 💡
凸集和交一定也是凸集,并则不一定
</aside>
称一个函数 $f:\mathcal{X}\rightarrow \mathbb{R}$ 是凸函数(convex function),若 $\forall a,b \in \mathcal{X}, \forall \lambda\in [0, 1], \lambda f(a) + (1-\lambda)f(b)\ge f\left(\lambda a + (1-\lambda)b\right)$
<aside> 💡
定义域是凸集保证了 $\lambda a + (1-\lambda)b$ 也在定义域内
</aside>
<aside> 💡
e.g. $E_{Y\sim P(Y)}\left[-\log P(X\mid Y)\right]\ge -\log P(X)$
</aside>