Image 1 Description

Image 2 Description

Image 1 Description

Image 2 Description

0%

原创统计学习随手小记

统计学习方法实现分类和类聚(五)-K近邻算法

发表于2023-10-27更新于2023-10-27

字数总计:455阅读时长:1分钟郑州

一、K近邻算法介绍

K近邻是一种不需要训练的分类方法，其基本思想为物以类聚，相近的样本属于同一类别的概率大。

假设待分类样本 $x$ 距离已知样本 $a$ 的距离最近，我们认同待分类样本 $x$ 与已知样本 $a$ 属同一类（男性）。反之，若距离已知样本 $b$ 距离最近则认同待分类样本 $x$ 与 $b$ 同类为女性。（以上均为最近邻）。

二、K近邻方法

以上最近邻方法存在一些疑问，当数据样本存在噪声时（假设样本标签存在标记错误）或有一些样本虽被标记为男性（女性）但不具备对应性别的典型特征，这样依据最近邻对待分类样本进行分类，为免存在武断，误判等问题。因此，为了解决这一问题，我们需要将视野扩大到待分类样本周围k个样本。这种方法就是K近邻算法

2.1 K值的影响

K近邻算法中若K取1，则为最近邻算法，K值的合适取值，决定着该算法的精度。K值的选择很难有一个定量的方法，基本上就是做实验。

2.2 距离计算

距离计算有很多种，这里介绍三种典型的距离计算方法。

2.2.1 欧氏距离

欧式距离实际上就是直线距离：

L_2(x_i,x_j)=\sqrt{(x_{i1}-x_{j1})^{2}-(x_{i2}-x_{j2})^{2}+...+(x_{in}-x_{jn})^{2}}

2.2.2 加权欧式距离

方差的倒数做加权： $a_k=\frac{1}{S_k}$ ，避免部分均方结果影响大：

L_2(x_i,x_j)=\sqrt

打赏作者

感谢你赐予我前进的力量

wechat
alipay

赞赏者名单

因为你们的支持让我意识到写文章的价值🙏

原创统计学习方法实现分类和类聚(五)-K近邻算法

文章作者: GanSer

文章链接: https://www.gan1ser.top/post/ea750ebe.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 GanSer！

相关推荐

24考研人还没考25考研狗已经把持不住了

51单片机中的电磁干扰问题

Git摘樱桃拆分commit进行提交

Pytorch中的EarlyStopping

Pytorch中的初始化权重

RGB图像、全色图像、多光谱图像、高光谱图像

评论

✅ 你无需删除空行，直接评论以获取最佳展示效果

博客快捷键

shift K

关闭快捷键功能

shift A

打开中控台

shift M

播放/暂停音乐

shift D

深色/浅色显示模式

shift S

站内搜索

shift R

随机访问

shift H

返回首页

shift F

友链鱼塘

shift L

友链页面

shift P

关于本站

shift I

原版右键菜单