统计学习方法-李航第三章 K近邻法

柔情只为你懂 2021-12-14 06:53 396阅读 0赞

### 简介 ###

K近邻 算法（KNN）是一种基本分类与回归方法，指从一个训练数据集中，找到相近的K个点，这K个实例多数属于某个类，就把输入实例分为这个类。特殊情况，当K=1时，称为最近邻算法。  
![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70]

#### 模型 ####

模型有3个要素

*  距离度量方法
 *  k值的选择
 *  分类决策规则  
    当3要素确定的时候，对任何实例（训练或输入），它所属的类都是确定的，相当于将特征空间分为一些子空间。  
    ![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 1]

##### 距离度量方法 #####

![在这里插入图片描述][201907081347357.png]

1.  当`p=1`时，为曼哈顿距离：  
    ![在这里插入图片描述][20190708134922569.png]  
    (X1，Y1)和(X2，Y2)的曼哈顿距离为|X1-X2|+|Y1-Y2|
2.  当`p=2`时，为欧式距离：  
    ![在这里插入图片描述][20190708134812950.png]  
    两个竖线表示欧氏距离（|| L1||），计算方式为每个维度差的平方式再相加后的开方。
3.  当`p=∞`时，塔式各个坐标距离的最大值：  
    ![在这里插入图片描述][20190708135107531.png]  
    ![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 2]  
    `**由不同的距离度量所确定的最近邻是不同的。**`

#### k值的选择 ####

*  k值比较小，近似误差会减小，估计误差会增大，容易被噪声影响，发生过拟合。
 *  k值比较大，估计误差会减小，近似误差会增大，较远的训练实例也会对预测起作用，容易发生错误。

`近似误差`：对现有训练集的训练误差  
`估计误差`：对测试集的测试误差

在应用中，K值一般取一个比较小的数值，通常采用交叉验证法来选取最优的k值。

#### 分类决策规则 ####

k近邻法中的分类决策规则往往是多数表决，有输入实例的k个邻近的训练实例中的多数类决定输入的实例类

### k近邻法的实现：kd树 ###

#### 构造kd树 ####

方法：  
![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 3]![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 4]  
看例子：  
![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 5]

#### kd树的搜索 ####

![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 6]![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 7]  
书中的例子已经可以说的足够明白：  
![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 8]

[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70]: /images/20211213/6cfab04a271c43c7a28f32ccc33d0a14.png
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 1]: /images/20211213/51db970a4caf4ec19a99eb3814519799.png
[201907081347357.png]: /images/20211213/3be106ca986a48cb9ea9b7797d029ffa.png
[20190708134922569.png]: /images/20211213/9b90f41f19214adc85ec90d143b1aead.png
[20190708134812950.png]: /images/20211213/503992d474b04776a276bc96e15d8258.png
[20190708135107531.png]: /images/20211213/5e82e9796dd548b08ab4d42b11450a9c.png
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 2]: /images/20211213/cd8a2b5c32ff4ef3a9df41257f0641cf.png
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 3]: https://img-blog.csdnimg.cn/20190708140345804.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1,size_16,color_FFFFFF,t_70
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 4]: /images/20211213/c0e765393c964c2b8c7e215fab0dd0b7.png
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 5]: /images/20211213/b53372401b064e7eb6866031cc5f24f8.png
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 6]: https://img-blog.csdnimg.cn/201907081410334.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1,size_16,color_FFFFFF,t_70
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 7]: /images/20211213/bf18b4e639204cb5a89e5a8b493e2857.png
[watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzIwOTg5MTA1_size_16_color_FFFFFF_t_70 8]: /images/20211213/9153452f17e549e18c8ccc70a7833508.png