博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
KNN算法
阅读量:5915 次
发布时间:2019-06-19

本文共 408 字,大约阅读时间需要 1 分钟。

KNN算法的核心思想:如果一个样本在特征空间中的k个最邻近的样本大多数属于某一类别,则该样本也属于该类别

KNN算法的结果很大程度上取决于K的取值,下面进行说明:

如果k=5 则上图中的红点属于三角形所属类,因为三角形所属类占3/5,而四边形类只占了2/5,如果k=11,则红点属于四边形类,四边形类占8/11,而三角形类占3/11

KNN中,样本的距离一般采用欧式距离或曼哈顿距离

 

欧式距离d(x,y)=sqrt(∑k=1 t0 n(xk-yk)2)

 

曼哈顿距离d(x,y)=sqrt(∑k=1 to nabs(xk-yk))

 

KNN算法的描绘:

(1) 计算测试数据与训练数据之间的距离

(2)将距离从小到大排序

(3)选取前K个样本

(4)确定K个样本所属类的频率

(5)将测试数据所属类标记为上述频率最高的类别

 

转载于:https://www.cnblogs.com/semen/p/6808394.html

你可能感兴趣的文章
使用nginx—搭建YUM仓库
查看>>
测试人员必学的软件快速测试方法(二)
查看>>
linux下以RPM包安装Oracle 客户端
查看>>
28. PowerShell -- 注册表操作
查看>>
搭建 android sdk环境
查看>>
LINUX常用的查看命令
查看>>
第14章 grep、sed、awk 正则表达式
查看>>
Game 游戏分类
查看>>
SCCM 2007 sp2 eva安装之一:sql server 2005安装及升级sp2
查看>>
电商企业适用基础快递接口对接demo
查看>>
通过chkconfig设置linux开机自启动服务- 老男孩Linux运维学习笔记1
查看>>
CENTOS 安装 jenkins
查看>>
iptables详解
查看>>
Kaptchar详细配置表
查看>>
Java程序员从笨鸟到菜鸟之(四十三)细谈struts2(六)获取servletAPI和封装表单数据...
查看>>
OSPF详述
查看>>
红黑树的原理分析和算法设计
查看>>
ant_Jmeter持续集成测试报告优化之添加throughput显示
查看>>
iostat介绍
查看>>
Linux计算字符串md5/sha1
查看>>