年中重磅：优青专题系列之三

优秀青年科学基金(“优青基金”)是国家自然科学基金委员会2012年起设立的一类人才项目，主要支持在基础研究方面已取得较好成绩的青年学者自主选择研究方向开展创新研究，至今已经资助了5期。为了集中介绍这些优秀青年学者的研究成果，本刊推出了“优青专题”系列，并已于2015年和2016年出版了两个专辑，本期是该系列的第三个专辑，共收录13篇文章。与前两次专辑一样，本专辑并不专注于介绍计算机科学技术领域某个特定方向的研究和发展状况，而是为优青基金获得者提供展示他们（及其合作者）研究成果、传播相关知识的综合平台，同时可以使得有关读者通过该专辑了解优青基金获得者（及其合作者）的研究进展及相关领域发展的趋势。我们希望本系列专辑的出版能为作者、读者提供一个开放的交流平台，促进计算机科学技术领域的研究、开发、教育和前沿知识的传播。

特约编辑：

刘克教授（基金委信息科学部）

刘志勇研究员（中科院计算所）

1—搜索引擎用户满意度评估（刘奕群，2016年优青）

对搜索用户的满意度评估能够为搜索引擎商业运营带来最直观的性能描述，因而关系到整个搜索系统质量的改进与优化，是网络搜索技术研究中的核心问题之一。针对传统搜索满意度评估研究中存在的诸多挑战，刘奕群的“搜索引擎用户满意度评估”一文对搜索满意度的用户感知规律与自动评估方法进行了深入研究。他们对用户感知到的结果效用与整体查询会话之间的关联关系进行了分析，系统地研究了垂直结果对用户满意度感知过程的影响，还提出了采用用户鼠标移动模式进行满意度预测的方法。基于真实用户行为实验的数据证实了上述方法的有效性和泛化能力。

2—神经机器翻译前沿进展（刘洋，2015年优青）

机器翻译是突破语言屏障、实现多语言信息获取的一项关键技术。神经机器翻译作为一种利用神经网络实现自然语言之间映射的新方法，在翻译性能上比传统方法有显著提升，近年来在机器翻译学术界和工业界受到高度关注。刘洋的文章“神经机器翻译前沿进展”介绍了神经机器翻译的核心思想和主要方法，并从训练算法、先验约束、模型架构、受限词汇量和低资源语言翻译等方面对该领域的重要前沿进展进行了评述。文章指出了当前神经机器翻译研究亟待解决的挑战性问题，并对未来可能的发展方向进行了展望，对相关研究具有参考意义。

3—情感分类研究进展（管子玉，2015年优青）

情感分析是自然语言处理的重要领域之一，建立于其上的智能应用能够惠及政府和民众。其核心问题在于情感分类，即如何让计算机准确判断文本的情感语义。陈龙等作者的文章“情感分类研究进展”详细介绍了该方向的研究成果。文章从五种不同的主流技术路线对情感分类问题进行综述，包括基于字典的方法、基于机器学习的方法、两者混合方法、基于弱标注信息的方法以及基于深度学习的方法。文章着重介绍了作者提出的面向情感分类的弱监督深度学习框架，以“弱监督预训练+有监督微调”为核心思想，有效缓解了深度学习缺乏有标注训练数据这个瓶颈问题。此外，文章还对情感分类的未来发展方向进行了探讨和展望。

4—面向标记分布学习的标记增强（耿新，2016年优青）

作为多标记学习的扩展，标记分布学习一改传统多标记学习范式中标记相关与不相关的二元设定，将不同标记的重要程度用标记分布来刻画，能够更好地匹配真实世界问题中不同标记重要程度不同的普遍现象。但是很多现有数据中却仅包含简单的逻辑标记而非标记分布。鉴于此，耿新等作者的文章“面向标记分布学习的标记增强”提出了标记增强的概念，即将逻辑标记转化为标记分布的过程。文章总结了现有的可用于标记增强的算法，进行了对比实验，结果表明，通过标记增强能够挖掘出数据中隐含的标记重要性差异信息，进而有效地提升多标记学习的效果。

5—基于概率分布的多峰演化算法（陈伟能，2016年优青）

分布估计算法是通过建立概率模型引导种群进化的一类新兴的演化计算方法，在求解复杂优化问题时具有多样性强等独特优势。陈伟能和杨强的文章“基于概率分布的多峰演化算法”概述了多峰优化演化算法的研究现状，总结了面向多解优化的概率分布演化算法框架和基于概率分布的集合型离散演化算法框架，为解决多解优化难题，突破算法在连续、离散空间中的通用性瓶颈提供了有效的新途径。

6—查询结果可用性研究综述（高云君，2015年）

查询结果可用性分析是数据库领域一个具有挑战性的研究前沿，对提高数据库可用性有着重要的作用。柳晴和高云君的文章“查询结果可用性研究综述”对当前的查询结果可用性工作进行了综述。作者介绍了查询结果可用性研究问题的类型及其特点，从Causality & Responsibility问题、Why-not & Why问题、以及Why-few & Why-many问题三个方面对现有的研究成果进行了归类、分析和总结，并对今后有待研究的重要问题作了展望。

7—分布式RDF数据管理综述（邹磊，2016年优青）

近年来，“知识图谱”成为学术界和工业界共同关心的一个热点研究领域，各种围绕着知识图谱的研究工作和相关系统及应用层出不穷。总体而言，计算机的不同领域围绕着“知识图谱”这个热点话题，从不同角度进行了大量的研究，包括知识工程、自然语言处理和机器学习等方面。邹磊和彭鹏的文章“分布式RDF数据管理综述”从数据库研究者的视角，探讨了海量知识图谱数据的管理问题；综述了海量的RDF知识图谱数据管理问题，同时也介绍了他们在分布式RDF数据库系统方面的最新研究工作。

8—高通量图像视频计算（唐金辉，2015年优青）

图像视频大数据在智能监控、无人平台、网络空间内容安全等领域发挥着重要作用，但图像视频大数据的实时计算成为了当前的瓶颈问题。高通量图像视频计算是一个有效的解决方案。唐金辉等作者的文章“高通量图像视频计算”分析了高通量图像视频计算技术，探讨了现有高通量图像视频计算方法研究的不足；分析了高通量图像视频计算理论、高通量图像视频分析方法以及高通量视频编码方法等三个未来的研究方向。文章总结了高通量图像视频计算需要解决的三个关键科学问题，对未来发展趋势进行了展望。

9—视频拷贝检测方法综述（姜育刚，2016年优青）

顾佳伟等作者的文章“视频拷贝检测方法综述”对若干种有代表性的视频拷贝检测方法进行了详细的回顾与总结,内容涵盖了特征提取、索引构建、特征匹配等关键技术模块。除了传统的基于局部特征的方法，文章还介绍了近期流行的深度学习在视频拷贝检测上的应用。为了对算法进行科学评测，作者列出了5个视频拷贝检测数据集及通用的评价标准，并探讨了视频拷贝检测技术的未来发展趋势。

10—融合语义知识的深度表达学习及在视觉理解中的应用（林倞，2016年优青）

计算机视觉是人工智能的重要研究领域。近几年来，深度学习在计算机视觉研究中获得了广泛应用。如何将传统视觉研究中的领域知识有效地融入到深度模型中，提升模型的表达和判别能力，是计算机视觉研究的重要方向。张瑞茂等作者的文章“融合语义知识的深度表达学习及在视觉理解中的应用”研究了如何将不同类型的语义知识融合到深度学习框架中，并有针对性地分析了不同条件下的模型结构及优化方法。相关研究内容在图像的相似性检索、场景的几何属性分析以及场景的结构化解析等视觉应用问题上取得了明显的效果。文章还对未来的研究内容和发展方向进行了探讨和展望。

11—多媒体信息检索中的查询与反馈技术（查正军，2016年优青）

多媒体检索是多媒体领域的重点研究方向，是发掘媒体大数据潜在价值的重要手段，具有广泛的应用需求。发展多媒体查询与反馈技术是提升检索性能的有效途径。查正军和郑晓菊的“多媒体信息检索中的查询与反馈技术”一文，梳理了查询与反馈技术的发展脉络，介绍了不同阶段的技术特征与代表性工作，简要介绍了探索式搜索的任务特点与关键问题。作者还对多媒体检索的研究趋势和有待研究的重要问题进行了展望。

12—动态蛋白质网络的构建、分析及应用研究进展（李敏，2016年优青）

蛋白质网络研究可以帮助人们深入理解蛋白质之间的相互作用及其功能，揭示复杂疾病发生、发展等网络生物学机制。李敏和孟祥茂的文章“动态蛋白质网络的构建、分析及应用研究进展”综合介绍了该领域的研究状况。文章在总结静态蛋白质网络特性及缺陷的基础上，对当前动态蛋白质网络的构建方法从基于表达动态性、基于多状态下表达及相关性变化和基于时空动态变化等方面进行了分类介绍和讨论。文章对动态蛋白质网络的蛋白质节点和相关子网络进行了分析并详细介绍了动态蛋白质网络分析方法在复杂疾病研究中的一些主流应用。

13—基于多核平台的高速网络流量实时捕获方法研究（李丹，2015年优青）

网络安全态势感知是网络安全防御的新兴技术。而网络安全态势感知的前提，是对网络流量全面实时捕获并进行大数据分析。针对传统的Linux网络协议栈在捕获高速流量数据包时存在的诸多性能瓶颈，令瑞林等作者的文章“基于多核平台的高速网络流量实时捕获方法研究”介绍了基于零拷贝、轮询IO、多核并行化等技术的一种新型数据包捕获与分析引擎，并基于Intel DPDK平台设计并实现了一个可扩展的数据包捕获系统。该系统能够利用RSS技术实现多核并行化的数据包捕获，并进行模块化的上层大数据处理。初步实验表明，该系统能够实现接近线速的流量捕获与识别，并且能在多个CPU核心之间均衡负载。

年中重磅：优青专题系列之三

相关内容