Skip to content

在支持向量机(SVM)中,表达式 f(x,θ)=⟨w,x⟩+bf(x,θ)=⟨w,x⟩+b 是分类决策函数的核心组成部分。下面详细解释其含义:

1. 符号解析

  • (x)( x ):输入样本的特征向量(列向量)
    • 例如:( x = [x_1, x_2, \dots, x_n]^T )((n)( n ) 维特征)
  • (w)( w ):权重向量(列向量)
    • 例如:( w = [w_1, w_2, \dots, w_n]^T )(决定每个特征的重要性)
  • (w,x)( \langle w, x \rangle ):向量内积(点积)
    • 计算式:(w,x=wTx=i=1nwixi)( \langle w, x \rangle = w^T x = \sum_{i=1}^n w_i x_i )
  • (b)( b ):偏置项(标量)
    • 控制分类超平面相对于原点的偏移
  • (θ)( \theta ):模型参数集合
    • (θ={w,b})( \theta = \{ w, b \} )

2. 几何意义

函数 (f(x,θ))( f(x, \theta) ) 定义了数据空间中的一个超平面

  • 分类超平面

    w,x+b=0\langle w, x \rangle + b = 0

    • 在二维空间中是一条直线(如图),三维空间中是一个平面。 SVM超平面示意图
  • 决策规则

    • (f(x,θ)>0)( f(x, \theta) > 0 ) → 预测为正类((y=+1)( y = +1 )
    • (f(x,θ)<0)( f(x, \theta) < 0 ) → 预测为负类((y=1)( y = -1 )

3. 计算示例

假设二维空间中:

  • 样本 (x=[2,3]T)( x = [2, 3]^T )
  • 权重 (w=[1,1]T)( w = [1, -1]^T )
  • 偏置 (b=1)( b = -1 )

则:

f(x,θ)=w,x+b=(1×2)+(1×3)+(1)=2f(x, \theta) = \langle w, x \rangle + b = (1 \times 2) + (-1 \times 3) + (-1) = -2

(f(x,θ)<0)( f(x, \theta) < 0 ),预测为负类。


4. 在SVM优化中的作用

SVM的目标是求解最优的 (w)( w )(b)( b )

  1. 最大化间隔
    间隔宽度为 (2w)( \frac{2}{\|w\|} ),需最小化 (w)( \|w\| )(即 (min12w2)( \min \frac{1}{2} \|w\|^2 ))。
  2. 约束条件
    对所有样本满足:

    yi(w,xi+b)1y_i (\langle w, x_i \rangle + b) \geq 1


5. 为什么需要偏置项 (b)( b )

  • 几何解释
    (b=0)( b = 0 ),超平面强制通过原点(如图红虚线),但实际分类边界可能需偏移(如图绿实线)。
  • 数学意义
    解决 (wTx=0)( w^T x = 0 ) 无法描述所有分类边界的问题。

6. 决策函数与分类边界的关系

最终分类函数为符号函数:

y^=sign(f(x,θ))=sign(w,x+b)\hat{y} = \text{sign} \left( f(x, \theta) \right) = \text{sign} \left( \langle w, x \rangle + b \right)

  • (f(x,θ)=0)( f(x, \theta) = 0 ) → 样本落在决策边界上
  • (f(x,θ))( |f(x, \theta)| ) 的值 → 样本到决策边界的距离

补充示例:对偶问题优化公式

SVM的对偶形式优化目标函数为:

minα12i,jαiαjyiyjxi,xjiαi\min_{\alpha} \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j y_i y_j \langle x_i, x_j \rangle - \sum_i \alpha_i


总结

表达式 (f(x,θ)=w,x+b)( f(x, \theta) = \langle w, x \rangle + b ) 是SVM的线性决策函数

  1. (w,x)( \langle w, x \rangle ) 计算特征加权和
  2. (b)( b ) 提供分类超平面的偏移能力
  3. 符号 (sign(f(x,θ)))( \text{sign}(f(x, \theta)) ) 决定样本类别
  4. SVM的优化过程即求解最优的 (w)( w )(b)( b ) 以最大化分类间隔。

知识如风,常伴吾身