AI 迟早灭了程序员

2018 年 10 月 19 日 人工智能头条

前言：

就目前的 AI 来看，判断某项工作是不是会被机器替代，有俩前提，大前提：可以获得足够的有效数据（能自动生成数据则无敌），也就是说机器有快速进化的基础；小前提：人本身的进化过程没有见过大量的数据，也就是说人的起点并不高。考虑到“自动生成数据”这个关键，我冥思苦想以后发现，还真没准是编程。

先来看看人工智能的本质是什么：

人工智能的发展离不开基础支持层和技术层，基础支持层包括大数据、计算力和算法；技术层包括计算机视觉、语音识别和自然语言处理。

一、计算机视觉技术

1、什么是计算机视觉

“人的大脑皮层的活动，大约70%是在处理视觉相关信息。视觉就相当于人脑的大门，其它如听觉、触觉、味觉那都是带宽较窄的通道。如果不能处理视觉信息的话，整个人工智能系统是个空架子，只能做符号推理，比如下棋、定理证明，没法进入现实世界。

计算机视觉是指用计算机代替人眼对目标进行识别、跟踪和测量的机器视觉，并进一步做图形处理，使计算机处理成为更适合人眼观察或传送给仪器检测的图像。

2、计算机视觉 VS 机器视觉

计算机视觉更关注图像信号本身以及图像相关交叉领域（地图、医疗影像）的研究；机器视觉则偏重计算机视觉技术工程化，更关注广义上的图像信号（激光和摄像头）和自动化控制（生产线）方面的应用。

3、计算机视觉识别技术的分类

物体识别分为“1 VS N”对不同物体进行归类，以及“1 VS 1”对同类型的物体进行区分和鉴别；物体属性识别，结合地图模型让物体在视觉的三维空间里得到记忆的重建，进而进行场景的分析和判断；物体行为识别分为3个进阶的步骤，移动识别判断物体是否做了位移，动作识别判断物体做的是什么动作，行为识别是结合视觉主体和场景的交互做出行为的分析和判断。

4、计算机视觉的识别流程

训练模型：样本数据包括正样本（包含待检目标的样本）和负样本（不包含目标的样本），视觉系统利用算法对原始样本进行特征的选择和提取训练出分类器（模型）；此外因为样本数据成千上万、提取出来的特征更是翻番，所以一般为了缩短训练的过程，会人为加入知识库（提前告诉计算机一些规则），或者引入限制条件来缩小搜索空间。

识别图像：会先对图像进行信号变换、降噪等预处理，再来利用分类器对输入图像进行目标检测。一般检测过程为用一个扫描子窗口在待检测的图像中不断的移位滑动，子窗口每到一个位置就会计算出该区域的特征，然后用训练好的分类器对该特征进行筛选，判断该区域是否为目标。

5、计算机视觉技术模式图和对应企业图

目前世界上图像识别最大的数据库，是斯坦福大学人工智能实验室提供的ImageNet，针对诸如医疗等细分领域也需要收集相应的训练数据；Google、Microsoft此类科技巨头会面向市场提供开源算法框架，为初创视觉识别公司提供初级算法。

二、语音识别

1、什么是语音识别

语音识别是以语音为研究对象，通过信号处理和识别技术让机器自动识别和理解人类口述的语言后，将语音信号转换为相应的文本或命令的一门技术。由语音识别和语音合成、自然语言理解、语义网络等技术相结合的语音交互正在逐步成为当前多通道、多媒体智能人机交互的主要方式。

2、语音识别的流程

语音信号经过前端信号处理、端点检测等预处理后，逐帧提取语音特征，传统的特征类型包括有MFCC、PLP、FBANK等特征，提取好的特征会送到解码器，在训练好的声学模型、语言模型之下，找到最为匹配的此序列作为识别结果输出。

3、语音识别技术模式图和对应企业图

基础层：包含大数据、计算力和算法三块，其中大数据等接入的是相应领域的第三方服务商。机器在识别人类的语音指令后接入、提供相应的服务。诸如影视、电影票、餐饮等；

技术层：以科大讯飞为首的语音技术提供商；

应用层：传统家居环境中的电视、音箱厂商都给加上了语音识别功能，新增交互方式；还有智能车载采用语音交互让手不离开方向盘提高安全系数；还有搜索厂商基于搜索做出来的语音助手等。

三、自然语言理解

1、什么是自然语言理解

自然语言理解即文本理解，和语音图像的模式识别技术有着本质的区别，语言作为知识的载体，承载了复杂的信息量，具有高度的抽象性，对语言的理解属于认知层面，不能仅靠模式匹配的方式完成。

2、自然语言理解的应用：搜索引擎+机器翻译

自然语言理解最典型两种应用为搜索引擎和机器翻译。搜索引擎可以在一定程度上理解人类的自然语言，从自然语言中抽取出关键内容并用于检索，最终达到搜索引擎和自然语言用户之间的良好衔接，可以在两者之间建立起更高效，更深层的信息传递。

3、自然语言理解技术在搜索引擎中的应用

4、自然语言理解技术在机器翻译中的应用

互联网衍生出新型的UGC模式：

知识分享数据：像维基百科、百度百科等都是人为校准过的词条，噪声小；

社交数据：像微博和微信等展现用户的个性化、主观化、时效性，可以用来做个性化推荐、情感倾向分析、以及热点舆情的检测和跟踪等；社区、论坛数据，像果壳、知乎等为搜索引擎提供了问答知识、问答资源等数据源。

另一方面，因为深度学习采用的层次结构从大规模数据中自发学习的黑盒子模式是不可解释的，而以语言为媒介的人与人之间的沟通应该要建立在相互理解的基础上，所以深度学习在搜索引擎和机器翻译上的效用没有语音图像识别领域来得显著。

四、人工智能知识体系大全

到底什么是人工智能？
人工智能可以解决什么问题？
零基础是否可以入门人工智能？

小白如何快速理解 AI 基础知识？有基础编程能力，怎样才能更快实战？为了回答这些问题，我专门设计了一期 GitChat 达人课《人人都能看懂的 AI 入门课》。本课程包含理论和实战两部分——

理论：人工智能的现状、应用场景和入门方法；

实战：通过运用 TensorFlow，配以对相应概念的讲解，实现一些简单的功能。

长按识别即刻试读

适宜人群

非技术出身希望学习人工智能的人士
非人工智能领域的技术人员希望入门人工智能的人士
希望了解人工智能轮廓的人士

购买须知

本课程为图文内容课程，共计 8 篇。
新用户购买立享五折优惠。
订购本课程可获得专属海报，分享专属海报每成功邀请一位好友购买，即可获得 25% 的返现奖励，多邀多得，上不封顶，立即提现。

点击 阅读原文 入门 AI 从现在开始

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【实用书】学习用Python编写代码进行数据分析，103页pdf

专知会员服务

198+阅读 · 2020年6月29日

【硬核书】理解机器学习：从理论到算法，449页pdf深度理解机器学习

专知会员服务

317+阅读 · 2020年5月28日

少标签数据学习，54页ppt

专知会员服务

203+阅读 · 2020年5月22日

【干货书】机器学习Python实战教程，366页pdf

专知会员服务

344+阅读 · 2020年3月17日

【Manning2020新书】R/mlr机器学习，513页pdf，Machine Learning with R

专知会员服务

131+阅读 · 2020年3月7日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

【经典书】Python计算机视觉编程，中文版，363页pdf

专知会员服务

143+阅读 · 2020年2月16日

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

人工智能算法工程师手册-程序员写的AI书《深度学习，统计学习，数学基础》，50章一书打尽

专知会员服务

211+阅读 · 2019年11月29日

【精通OpenCV 4】Mastering OpenCV 4 - Third Edition 随书代码

专知会员服务

40+阅读 · 2019年11月13日

值得收藏丨一文读懂人脸识别技术

物联网智库

4+阅读 · 2019年2月11日

【机器视觉】计算机视觉技术在无人驾驶中的目标检测、图像识别的未来：机遇与挑战并存

产业智能官

5+阅读 · 2019年1月12日

【机器视觉】机器视觉全面解析

产业智能官

12+阅读 · 2018年11月12日

AI综述专栏 | 人脸检测算法综述

人工智能前沿讲习班

6+阅读 · 2018年9月10日

一图看懂新一代人工智能知识体系大全

人工智能学家

14+阅读 · 2018年8月14日

带你入门Python数据挖掘与机器学习（附代码、实例）

数据派THU

13+阅读 · 2018年4月6日

Python | 拯救鉴黄师

计算机与网络安全

5+阅读 · 2018年2月17日

书单 | 计算机视觉的修炼秘笈

AI科技评论

6+阅读 · 2018年2月14日

GAN | GAN介绍（2）

中国科学院网络数据重点实验室

44+阅读 · 2017年8月4日

CNN超参数优化和可视化技巧详解

量子位

4+阅读 · 2017年7月15日

Learning in the Frequency Domain

Arxiv

11+阅读 · 2020年3月12日

Invariance-Preserving Localized Activation Functions for Graph Neural Networks

Arxiv

4+阅读 · 2019年11月5日

DeepFakes: a New Threat to Face Recognition? Assessment and Detection

Arxiv

6+阅读 · 2018年12月20日

A Probe into Understanding GAN and VAE models

Arxiv

9+阅读 · 2018年12月13日

Visual Question Answering as Reading Comprehension

Arxiv

3+阅读 · 2018年11月29日

Generative Dual Adversarial Network for Generalized Zero-shot Learning

Arxiv

7+阅读 · 2018年11月12日

Learning from Longitudinal Face Demonstration - Where Tractable Deep Modeling Meets Inverse Reinforcement Learning

Arxiv

3+阅读 · 2018年9月4日

Leveraging Social Signal to Improve Item Recommendation for Matrix Factorization

Arxiv

6+阅读 · 2018年5月17日

Mask-aware Photorealistic Face Attribute Manipulation

Arxiv

5+阅读 · 2018年4月24日

Dynamic Zoom-in Network for Fast Object Detection in Large Images

Arxiv

20+阅读 · 2018年3月27日

VIP会员