AR与AI融合的未来

2017 年 7 月 10 日 AR酱 黑猫酱


↑  ↑  ↑      关注AR酱,

和我们一起发现闪闪发光的AR从业者!

公告


愿意投稿的老师请加

18521503035

 

黑猫酱

愚蠢的人类,你们可能正在撸一支AI猫



科技界的巨头们对AR都投入了十分的热情,分析师也纷纷看好AR,认为AR设备会在未来取代手机,成为人们日常生活中的必备。

未来的AR眼镜应该是什么样子?

照我看,应该是一个可以在任何一个场景中实现增强现实的工具,一个万能辅助神器。

再也不会迷路,道路指引会实时显示在眼镜上。

有不会做的题?So easy,AR眼镜,哪里不会看哪里。

除了能让我们对真实世界了解的更加详实,还可以做比如说在空无一物的墙上挂一副虚拟日历,在墙上放一台虚拟电视机,这些创造的功能。

有时候想着想着,就泛起了一阵生早了的失落感。

人工智能也是一定会改变人类的生活方式的,AI作为一种行为方式,和AR这种表现手段,看似不太相交,但是AR想要实现我们对未来的种种幻想,就必然和人工智能紧密结合。

因为目前的所有智能设备,其实都无法真正看懂我们这个世界,也就无法做到像人类一样去认识了解周围的一切,这会极大的制约AR的能力。



AR识别追踪技术


AR识别追踪技术一般分为三类:

  1. 基于视觉标记

  2. 基于自然特征

  3. SLAM

基于自然特征的跟踪技术则是利用特征点提取,检测方法一般有:FAST、Harris、SIFT、SURF、MSER 等

接下来再进行目标图和识别图之间的匹配。

分别获取两幅图像的特征点及特征点描述子,根据一定的算法,对两幅图进行匹配,找到匹配程度最高的最优值。


SLAM则高端很多,它获取的是空间的三维信息。而不再只通过2D的光学图像了解周围环境。


然而上述这三种AR的识别技术,都称不上多智能,现在的AR完全看不懂这个世界。



机器学习


图片上的猫做出了各种不同的姿势,展现的角度不同。

但是在人看来,无论是躺着趴着,或者跳起来,这都是猫,并且是同一只猫。

但是我们还要教会机器认识这只猫。

所以,怎么让机器认识一只猫。

机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。



深度学习


机器学习和深度学习同属人工智能的范畴。

深度学习是人工智能中发展迅速的领域之一,可帮助计算机理解大量图像、声音和文本形式的数据。

虽然神经网络的概念很早在上世纪八九十年代就提出来了,但是多年以来一直没有流行起来。但是科研工作者发现卷积和长短期记忆网络后,神经网络突然迎来了爆发期。

神经网络的基本特点是,模仿大脑的神经元之间的传递,来处理信息。


我们人看到一幅图像,眨眼之间就知道图像中有什么,图像中的主体在干什么。但计算机不同,计算机看到的每一副图像都是一个数字矩阵。那我们怎么让计算机从一个个数字矩阵中得到有用的信息呢,比如边缘,角点?更甚一点,怎么让计算机理解图像呢?

我们首先要对图像进行卷积。

所谓对图像卷积,就是求卷积核作用在图像(二维离散信号)后得到的图像对于该卷积核的累加响应。

神经网络是具有层级的特点的,首先将图像提取“局部特征”,这作为最基础的一层。上层则把一部分“局部特征”整合,形成新的“局部特征”。

为什么CNN要设计这么多层呢?

比方说,猫的头是一个特征,但是对于充斥着像素点的图像来说,用几个卷积核直接判断存在一个猫头的还是太困难,所以,把猫头也作为一个识别目标,比如猫头应该具有更底层的一些语义特征,比如应该有猫的眼睛、猫的耳朵、猫的鼻子等等。这些特征有的还是太高级了,没关系,继续向下寻找低级特征,一直到最低级的像素点,这样就构成了多层的神经网络。

除了卷积层,还有池化层、全连接层,每个都是层级结构。

接下来进行训练

通过无数样本的训练,机器对于图像的识别能力越强。可以轻松进行分类,目前利用深度学习的图像识别率可以高达99%以上,甚至比人类更强。



未来展望


利用深度学习,除了可以让设备对周围环境有更强的理解能力之外,还能增强和人之间的交互。

比如手势操作。

美国印第安纳州的普渡大学西拉法叶分校的研究工作者,利用深度学习算法为虚拟增强现实技术提供了新型系统——“深度手控”(DeepHand),能让计算机理解复杂的人类手势。

目前最大的阻碍大概就是硬件了,深度学习依赖计算性能强大的GPU,还在实验室层级,不用说走向移动端了。

慢慢等吧,谁叫我们生这么早呢。




AR酱原创

转自微信号AR酱(ARchan_TT)

并附上原文链接


阅读推荐

酱发现 | 裸眼AR不是梦,就是浪费空气清新剂

酱深度 | 视觉辐辏调节冲突的解决之道在哪?

酱发现 | Sketchfab:3D模型分享界的Youtube


“呐,做 AR VR,最重要的就是开心啦”

梦想重要,开心也重要

当你有有趣的想法时,也要来AR酱上

和我们一起分享啊


关注一下好不好



    点击下方“阅读原文”留下联系信息


登录查看更多
0

相关内容

增强现实(Augmented Reality,简称 AR),是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术,这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。
高效医疗图像分析的统一表示
专知会员服务
35+阅读 · 2020年6月23日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
111+阅读 · 2020年6月5日
【天津大学】风格线条画生成技术综述
专知会员服务
34+阅读 · 2020年4月26日
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
专知会员服务
125+阅读 · 2020年3月26日
【文献综述】边缘计算与深度学习的融合综述论文
专知会员服务
166+阅读 · 2019年12月26日
Gartner 报告:人工智能的现状与未来
InfoQ
14+阅读 · 2019年11月29日
鼠标终将消失,未来我们有哪些人机交互方式?
人工智能学家
5+阅读 · 2018年11月25日
【学科发展报告】计算机视觉
中国自动化学会
42+阅读 · 2018年10月12日
推荐|改变你对世界看法的五大计算机视觉技术!
全球人工智能
4+阅读 · 2018年4月14日
【机器视觉】计算机视觉简介:历史、现状和发展趋势
计算机视觉简介:历史、现状和发展趋势
北京思腾合力科技有限公司
10+阅读 · 2017年11月22日
【人工智能】人工智能中的语义分析技术及其应用
产业智能官
3+阅读 · 2017年9月4日
2017中国多媒体大会-智能媒体 创新未来
中国计算机学会
3+阅读 · 2017年8月21日
Learning Discriminative Model Prediction for Tracking
Polarity Loss for Zero-shot Object Detection
Arxiv
3+阅读 · 2018年11月22日
Arxiv
6+阅读 · 2018年2月6日
VIP会员
相关VIP内容
高效医疗图像分析的统一表示
专知会员服务
35+阅读 · 2020年6月23日
【开放书】SLAM 中的几何与学习方法,62页pdf
专知会员服务
111+阅读 · 2020年6月5日
【天津大学】风格线条画生成技术综述
专知会员服务
34+阅读 · 2020年4月26日
德勤:2020技术趋势报告,120页pdf
专知会员服务
191+阅读 · 2020年3月31日
专知会员服务
125+阅读 · 2020年3月26日
【文献综述】边缘计算与深度学习的融合综述论文
专知会员服务
166+阅读 · 2019年12月26日
相关资讯
Gartner 报告:人工智能的现状与未来
InfoQ
14+阅读 · 2019年11月29日
鼠标终将消失,未来我们有哪些人机交互方式?
人工智能学家
5+阅读 · 2018年11月25日
【学科发展报告】计算机视觉
中国自动化学会
42+阅读 · 2018年10月12日
推荐|改变你对世界看法的五大计算机视觉技术!
全球人工智能
4+阅读 · 2018年4月14日
【机器视觉】计算机视觉简介:历史、现状和发展趋势
计算机视觉简介:历史、现状和发展趋势
北京思腾合力科技有限公司
10+阅读 · 2017年11月22日
【人工智能】人工智能中的语义分析技术及其应用
产业智能官
3+阅读 · 2017年9月4日
2017中国多媒体大会-智能媒体 创新未来
中国计算机学会
3+阅读 · 2017年8月21日
Top
微信扫码咨询专知VIP会员