跨媒体智能是新一代人工智能的重要组成部分,通过视听感知、机器学习和语言计算等理论和方法,构建出实体世界的统一语义表达,通过跨媒体分析和推理把数据转换为智能,从而成为各类信息系统实现智能化的“使能器”。跨媒体智能引擎研究可在现有计算平台上进行,但是它的广泛应用需要研制更为高效的智能芯片和硬件,才能像生物大脑和感知系统那样以极低功耗来高效地表达外部世界的复杂结构。
幽居于颅骨内的人类大脑通过视觉、听觉、语言等感知通道获得对世界的统一感知,这是人类智能的源头。跨媒体智能就是要借鉴生物感知背后的信号及信息表达和处理机理,对外部世界蕴含的复杂结构进行高效表达和理解,提出跨越不同媒体类型数据进行泛化推理的模型、方法和技术,构造模拟和超越生物感知的智能芯片和系统。
跨媒体智能理论研究主要围绕跨媒体感知计算理论展开,从视、听、语言等感知通道把外部世界转换为内部模型的过程出发,实现智能感知和认知。主要包括:研究超越人类视觉感知能力的视觉信息获取,有效支撑对环境的全景、全光与透彻感知;研究能够适应真实世界复杂场景的主动视觉系统,发展复杂环境感知、建模和交互等技术,构建主动感知框架和技术体系;研究自然声学场景下的听觉感知及计算,实现复杂声学场景中语音定位和增强;突破真实自然交互环境中的语音识别鲁棒性、语音合成表现力、口语理解准确率等难点问题;研究自然交互环境中的言语感知及计算,实现类人的多语种多方言的言语感知和多语种多方言间的言语感知迁移;建立面向异步跨模态序列的类人感知和交互理论,研制突破图灵测试的跨模态社交机器人,实现与人类和谐地进行多模态互动和沟通;研究面向媒体智能感知的自主学习,发展仿人脑记忆的媒体协同分析方法。
对实体物理世界和虚拟理念世界的有效表达是智能的基础。经典人工智能通过谓词、命题和规则等方法在充分定义前提下进行推理,逻辑清晰,但未能有效解决符号系统和实体世界的对应问题,知识工程试图建立完备的常识库与常识推理引擎,但缺乏源头活水。如今外部环境已经发生重大变化,互联网、物联网和大数据的快速发展,正在将我们所在的物理世界通过海量传感器和多模态数据进行全天候描述,为建立物理实体世界的统一语义表达创造了外部条件,信息传播已经从文本、图像、视频、音频等单一媒体形态过渡到相互融合的跨媒体形态,如何将文本推理扩展到跨媒体分析推理成为了重要的研究问题。
在新一代人工智能发展规划中,跨媒体智能关键技术层面的研究主要围绕跨媒体分析推理展开,即通过视、听、语言等感知来分析挖掘跨媒体知识以补充和拓展传统基于文本的知识体系,建立跨媒体知识图谱,构建跨媒体知识表征、分析、挖掘、推理、演化和利用的分析推理系统,形成跨媒体综合推理技术,为跨媒体公共技术和服务平台的建设提供技术支撑,并在网络空间内容安全与态势分析、跨模态医疗数据综合推理等领域进行示范应用。
跨媒体智能的真正应用需要智能芯片和硬件的支持。机器感知一直是传统人工智能的薄弱环节,需要模拟生物视、听、嗅、味、触等感知通道的信号处理和信息加工模型,研制新型感知芯片并进行系统实验和验证。例如,仿视网膜神经网络结构和机理的高灵敏、高动态、高保真视觉芯片能够模拟生物视觉事件驱动、稀疏表示和异步传输等机理,达到“结构模仿生物视觉,速度超越生物视觉”的效果。又如,模拟多种生物(如灵长类、猫、响尾蛇等)的独特视觉机理,建立从复杂视频图像数据中快速搜索兴趣目标的理论、模型和算法,实现具备自适应、自学习能力的智能感知系统。再如,研究模拟生物皮肤的高灵敏度触觉感知器件和芯片,构建主动接触和精细反馈的触觉传感器和电子皮肤。
跨媒体智能的一个典型综合应用是智能城市。研究城市全维度智能感知推理引擎,解决城市发展过程中存在的感知碎片化、信息孤岛化等问题,建立以“大跨度、大视角、大信息和大服务”为特征的城市全维度智能感知推理引擎,实现对人、车、物、事件等的多维度、跨时空协同感知和综合推理。
另外,跨媒体智能技术还能够推进企业智能制造转型,为经济增长注入新活力,提升中国经济的发展质量。跨媒体智能引擎还将在智能医疗等重要领域得到应用,从而将对国民经济、国计民生、国家安全等产生重要影响。
来源:中国科技网
往期文章推荐
🔗【重要通知】2018智能汽车跨界融合高峰论坛将于6月28日在江苏常熟召开
🔗【通知】中国自动化学会关于推荐联合国 可持续发展目标青年工程师奖项候选人的通知
🔗【IV18】特邀主旨报告嘉宾及日程重磅出炉! 第29届IEEE国际智能车大会(IV 2018)即将盛大开幕
🔗【CAC2018】2018中国自动化大会论文投稿截止日期变更通知