在k-means或kNN,我们常用欧氏距离来计算最近的邻居之间的距离,有时也用曼哈顿距离,请对比下这两种距离的差别

2019 年 4 月 4 日 七月在线实验室


今日面试题分享

在k-means或kNN,我们常用欧氏距离来计算最近的邻居之间的距离,有时也用曼哈顿距离,请对比下这两种距离的差别



解析:


欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为:



欧氏距离虽然很有用,但也有明显的缺点。它将样本的不同属性(即各指标或各变量量纲)之间的差别等同看待,这一点有时不能满足实际要求。例如,在教育研究中,经常遇到对人的分析和判别,个体的不同属性对于区分个体有着不同的重要性。因此,欧氏距离适用于向量各分量的度量标准统一的情况。


曼哈顿距离,我们可以定义曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是在欧几里得空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。例如在平面上,坐标(x1, y1)的点P1与坐标(x2, y2)的点P2的曼哈顿距离为:,要注意的是,曼哈顿距离依赖座标系统的转度,而非系统在坐标轴上的平移或映射。当坐标轴变动时,点间的距离就会不同。


通俗来讲,想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。而实际驾驶距离就是这个“曼哈顿距离”,这也是曼哈顿距离名称的来源, 同时,曼哈顿距离也称为城市街区距离(City Block distance)。


曼哈顿距离和欧式距离一般用途不同,无相互替代性。


另,关于各种距离的比较参看《从K近邻算法、距离度量谈到KD树、SIFT+BBF算法》(链接:http://blog.csdn.net/v_july_v/article/details/8203674)。



题目来源:七月在线官网(www.julyedu.com)——面试题库——面试大题——机器学习


END



今日学习推荐


机器学习集训营第八期

火热报名中


2019年4月15日开课


前50人特惠价:14399 


报名加送18VIP[包2018全年在线课程和全年GPU]


且两人及两人以上组团还能各减500元

有意的亲们抓紧时间喽


咨询/报名/组团可添加微信客服

julyedukefu_02


扫描下方二维码

免费试听


长按识别二维码



人工智能人才争抢白热化?学好数学才能C位出道!

哪些机器学习算法不需要做归一化处理?

一文详解:什么是B树?

机器学习中的数学基础(微积分和概率统计)

34个最优秀好用的Python开源框架

【实战分享】电影推荐系统项目实战应用

Python打牢基础,从19个语法开始!



扫描下方二维码  关注:七月在线实验室 


后台回复:100   免费领取【机器学习面试100题】

后台回复:干货 免费领取全体系人工智能学习资料

后台回复: 领资料  免费领取全套【NLP工程师必备干货资料】

▼更多精彩推荐,请关注我们▼
把时间交给学习
“阅读原文”我们一起进步
在看点一下
登录查看更多
2

相关内容

专知会员服务
42+阅读 · 2020年7月7日
麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》
专知会员服务
50+阅读 · 2020年2月19日
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
L1和L2正则先验分别服从什么分布
七月在线实验室
11+阅读 · 2019年5月8日
树形结构为什么不需要归一化?
七月在线实验室
8+阅读 · 2019年4月30日
今日面试题分享:简单介绍下LR
七月在线实验室
7+阅读 · 2019年2月20日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
AI笔试面试题库-Python题目解析1
七月在线实验室
5+阅读 · 2018年6月27日
机器学习的5种距离度量方法
七月在线实验室
9+阅读 · 2018年5月18日
一文解读聚类中的两种流行算法
量子位
6+阅读 · 2017年11月20日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
Neural Response Generation with Meta-Words
Arxiv
6+阅读 · 2019年6月14日
Arxiv
24+阅读 · 2018年10月24日
Labeling Panoramas with Spherical Hourglass Networks
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Arxiv
7+阅读 · 2018年1月10日
VIP会员
相关资讯
机器学习计算距离和相似度的方法
极市平台
10+阅读 · 2019年9月20日
L1和L2正则先验分别服从什么分布
七月在线实验室
11+阅读 · 2019年5月8日
树形结构为什么不需要归一化?
七月在线实验室
8+阅读 · 2019年4月30日
今日面试题分享:简单介绍下LR
七月在线实验室
7+阅读 · 2019年2月20日
BAT机器学习面试1000题(716~720题)
七月在线实验室
19+阅读 · 2018年12月17日
BAT机器学习面试题1000题(331~335题)
七月在线实验室
12+阅读 · 2018年8月13日
AI笔试面试题库-Python题目解析1
七月在线实验室
5+阅读 · 2018年6月27日
机器学习的5种距离度量方法
七月在线实验室
9+阅读 · 2018年5月18日
一文解读聚类中的两种流行算法
量子位
6+阅读 · 2017年11月20日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
相关论文
Neural Response Generation with Meta-Words
Arxiv
6+阅读 · 2019年6月14日
Arxiv
24+阅读 · 2018年10月24日
Labeling Panoramas with Spherical Hourglass Networks
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Arxiv
7+阅读 · 2018年1月10日
Top
微信扫码咨询专知VIP会员