中国科学院网络数据科学与技术重点实验室(以下简称“实验室”)依托于中国科学院计算技术研究所,成立于2013年,是我院第一个在大数据领域开展基础理论研究与关键技术研发的院重点实验室。实验室在学术委员会的学术指导和计算技术研究所的大力支持下,围绕大数据与数据科学展开研究,在学科建设、队伍建设、人才培养、成果转化以及对外学术交流等方面均取得了丰硕的成果,已发展成为我国大数据领域的重要基础研究基地。
博导介绍
李国杰,中国工程院院士,第三世界科学院院士, 1994年获得 首届何梁何利基金科技进步奖,1995年被评为国家级有突出贡献的中青年专家,1999年获潘文渊研究杰出奖,2000年被评为全国先进工作者,2001年获得美国普渡大学电机学院杰出校友奖,2006年获得首届信息界学术大会最高学术大奖。
研究方向:计算机体系结构、并行算法、人工智能、计算机网络等方面的研究。
长期从事国家863计划高技术研究,现任国家“973计划”项目首席科学家。主持研制成功曙光1号并行计算机、曙光1000大规模并行机和曙光2000/曙光3000超级服务器,领导研制成功曙光4000超级服务器、曙光5000A高效能计算机,其中,曙光1号获1994年中国科学院科技进步特等奖和1995年国家科学技术进步二等奖;曙光1000获得1996年中国科学院科技进步特等奖和1997年国家科学技术进步一等奖。曙光2000和曙光3000分别获得2001年和2003年国家科技进步二等奖。领导计算所研制成功龙芯高性能通用CPU。
程学旗,研究员,中科院计算所副所长,网络数据重点实验室主任,杰出青年基金获得者,中科院大数据方向带头人,博士生导师。
研究方向:大数据科学、大数据分析系统、社会计算、Web信息检索与数据挖掘。
近五年持续在Web信息检索、网络数据科学、数据挖掘等领域的重要国际会议和期刊上发表学术论文60余篇。获得ACM SIGIR 2012最佳学生论文奖和ACM CIKM 2011最佳论文奖。获得基金委“杰出自然科学青年基金”资助,获得中组部“万人计划”科技创新领军人才,第十二届中国青年科技奖,CCF青年科学家、中科院青年科学家等荣誉。
郭嘉丰,研究员,博士生导师,网络数据重点实验室主任助理,智能搜索方向负责人
研究方向:信息检索、数据挖掘、深度学习
长期从事信息检索与数据挖掘方向的研究,研究工作包括用户查询理解、文本内容表达、网络信息排序等,目前主要关注表达学习与深度学习搜索方向。近5年(2011年至今)在国内外共发表学术论文80余篇,其中SCI收录14篇,论文SCI他引230余次,GoogleScholar引用1800余次。在信息检索领域的顶级国际会议SIGIR发表论文12篇, Web搜索与挖掘领域的高水平国际会议发表论文26篇(包括:WWW, AAAI, NIPS, ACL, CIKM, ICDM,WSDM等)。研究工作获得SIGIR 2012 Best Student Award、CIKM 2011 Best Paper Award,研究成果获得国家科技进步二等奖、中国电子学会电子信息科学技术一等奖、中国中文信息学会“钱伟长中文信息处理科学技术奖——汉王青年创新奖”一等奖,入选中国科学院青年创新促进会优秀会员以及中国科学院科教融合两类人才。
徐君,研究员,博士生导师,学术带头人,课题组组长
研究方向:排序学习与大数据分析系统
出版英文学术专著1部(NOW Publishers),在重要的国际学术会议和期刊(如:TOIS,JMLR,SIGIR,WWW,WSDM,ACL等)上发表论文40余篇,获得美国专利授权8项,专著和论文在谷歌学术中被引用2500余次,被提名参评SIGIR ‘17 Test of Time Award。他所提出的算法被国际知名的教科书和计算机手册收录,在包括斯坦福大学在内的知名大学课程中讲解,被知名信息检索开源软件Lemur所采用。徐君同时活跃于学术界和工业界,在2017年,他担任了SIGIR ‘17和ACML ‘17的领域主席(Area chair/SeniorPC)、ICBDA ‘17的共同程序委员会主席(PC co-chair),担任KDD ‘17,NIPS ‘17,CIKM ‘17以及WSDM ‘17的程序委员会委员(PC member),为TOIS,JMLR和TKDE等期刊审稿;徐君也参与了多个商业搜索产品(如:微软必应搜索、微软Office SharePointSearch及华为GTS搜索等)的技术开发,创立了Github开源项目Easy Machine Learning。获得AIRS ‘10和ICMLC ‘05最佳论文奖、2016年度计算所曙光奖教金奖。
王元卓,研究员,中国科学院计算技术研究所科研处副处长,博士生导师,中科院青促会会员,北京市科技新星
研究方向:网络大数据分析、开放知识网络计算、社交网络演化分析、网络与信息安全、隐私泄漏行为分析等。
目前,已主持了包括4项国家自然科学基金项目,973计划子课题,863计划重点项目课题,中国科学院创新工程重点项目课题,国家科技支撑计划课题、国家发改委信息安全专项在内的重要科研项目20余项。同时,承担了面向特定领域的知识库构建与分析展示、网络舆情监测与分析、信息安全风险关联分析、安全运维与应急响应等方面的多项关键技术和系统产业化项目。
已在网络数据科学等领域发表论文150余篇,其中包括重要国际会议上发表学术论文20余篇(包括:WWW、AAAI、CIKM、ICNP等),在数据安全、智能分析和综合性重要国际期刊上发表或被录用论文30余篇(包括:ACM/IEEE Trans.、Plos One等),获得CIT 2015最佳论文奖和CCF BigData 2015 最佳学术论文奖。其中SCI检索26篇,主要创新点被10多个国家和地区的知名学者广泛引用,Google scholar引用1800余次,单篇最高下载60000余次,单篇最高引用500余次,h-index指数18。申请发明专利41项,获授权发明专利15项,软件著作权4项。研究成果在权威国际评测TAC2014、TAC2016和ACL SIGHAN 2014中共获得6项指标第一名,14项指标第二名。系统性研究成已出版学术专著5部。
成果应用到多家国家重要业务单位和知名企业,在重要线索挖掘与发现、新闻语义搜索与推荐、领域知识库快速构建与分析等方面发挥了作用。获得国家科技进步二等奖(2012年)、北京市技术发明二等奖(2015年)、中国电子学会电子信息科学技术一等奖(2011年)、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖(2014年)和中国电子学会技术发明二等奖(2014)。并入选了北京市科技新星人才计划(2012)和中科院青年促进会人才计划(2011)。
靳小龙,副研究员,博士生导师,知识计算方向负责人,CCF大数据专家委员会副秘书长
研究方向: 知识图谱、知识计算、社会计算、大数据分析等
2005年于香港浸会大学获得博士学位;2005-2010年于英国Bradford大学信息学院进行博士后研究后任研究员(Research Fellow)。迄今为止共出版专著2部(分别由Springer与清华大学出版社出版);发表国内外学术期刊与会议论文140余篇,SCI收录40篇,EI收录75篇,获得国际会议CIT-2015,AINA 2007与ICAMT 2003的最佳论文奖,国内会议CCF Big Data 2015的最佳学生论文奖;申请/获得专利10余项,Google Scholar引用达3200余次。目前担任Web Intelligence: AnInternational Journal (WI) 与《大数据》等国内外期刊的编委,7次担任Journal of Computerand System Sciences等国内外学术期刊的特邀客座编辑,40多次出任学术会议或专题会议的主席/副主席(包括IAT,CIT, ScalCom,HPCC, IUCC 等),连续6年担任中国大数据技术大会组委会主席,80多次担任国际学术会议(包括AAAI,WSDM,ATC,LCN,IAT,AAMAS 等)程序委员会委员;负责或作为骨干参与项目/课题近20项,包括国家重点研发计划课题、973课题、863课题、国家自然科学基金项目(重点、面上、青年)、欧盟FP7与FP6项目、英国EPSRC项目等;2015年获得中国电子学会科技进步一等奖;2012年获得IEEE InternationalConference on Ubiquitous Computing and Communications的OutstandingLeadership Award;2010年获得IEEE联合会议CIT-2010,ScalCom-2010与ICESS-2010的卓越服务奖。
硕导介绍
余智华,正高级工程师、硕士生导师、网络数据科学与技术重点实验室副主任。
研究方向:海量互联网数据的智能处理,及其在网络舆情分析、商业智能、互联网信息服务等领域的应用
长期从事大规模网络信息内容处理及信息安全等领域的研究与应用,先后承担了多项国家863、国家973、242、科学院知识创新工程等科研项目,主持研发了天玑网络舆情监测系统、天玑垂直搜索系统、天玑大数据平台等大型应用系统和数据平台。核心技术和系统应用于多个国家重要业务和主管部门,并在多项国家重大战略性任务中得到规模化应用,取得了显著的应用成效。先后荣获国家科技进步二等奖、电子学会电子信息科学技术奖一等奖、证券期货业科学技术二等奖等奖励。
刘悦,副研究员,硕导,网络数据重点实验室副主任
研究方向:互联网搜索与数据挖掘、网络科学与社会计算
作为组织委员会主席参与组织了NCIRCS2007、NCIRCS20082届全国信息检索和内容安全年会,发表学术论文40余篇。承担了多项国家自然科学基金、国家信息安全计划、863等课题。
廖华明,副研究员,硕导,网络数据重点实验室主任助理,烟台分所副所长
研究方向:数据集成、分布式数据处理
上海证券交易所新一代信息系统消息总线项目总体架构技术负责人、中国国家网格软件基准测试规范的技术负责人。曾主持研究了上海证券交易所新一代应用消息传输标准,主持“大规模数据处理环境构建与相关研究”及“Hadoop商用化原型合作项目”研发工作,作为执行负责人之一主持国家搜索引擎-人民搜索引擎系统及关键技术研发。在行业信息化、信息集成、分布式数据处理系统的研发方面有丰富的经验。荣获国家科技进步二等奖、中国电子学会电子信息科学技术一等奖等奖励。
查礼,副研究员,硕导,课题组组长
研究方向:分布式与网格计算系统、分布式系统软件、分布式资源管理及调度、分布式系统性能分析等
作为课题负责人承担多项国家科研课题和国际合作研究项目,如国家863计划“中英网格试验平台核心技术及应用研究”子课题,科技部科技大平台“国家网络计算环境平台建设”子课题,英国e-Science计 划“ICTGridSAM”、“EMeRGE”项目等。 作为课题技术总负责人参与国家863计划“中国国家网格软件研究与开发”课题,负责CNGrid GOS总体设计,软件开发和课题协调工作。研究重点是大规模分布式资源管理和调度,包括资源命名和组织,策略管理等。研究兴趣还包括分布式及网格计算系统,大规模数据处理,分布式系统性能评价等。曾获2007年度国家科技进步二等奖。
沈华伟,副研究员,硕导,中科院卓越青年科学家,中科院青促会会员
研究方向:社会网络分析、网络结构分析、信息传播预测、群体行为分析等。
在网络结构分析方面,提出了基于尺度变换的多尺度重叠社区发现方法,开发了多尺度重叠社区发现工具EAGLE,被全球数百个研究同行使用,并被网络分析软件Cytoscape列为网络社区分析的三个代表性工具之一;在信息传播预测方面,提出了静态贪心算法和自洽排序策略,解决了影响力最大化贪心算法长期面临的精度和速度难以兼顾的问题,是目前有精度保障的影响力最大化算法中单机最快的算法之一;在群体行为分析方面,提出了群体功劳分配策略,克服了科研合作中个体贡献判定缺少定量依据、学科间分配规则差异大等难题,论文发表在《美国科学院院刊》(PNAS)上,为发表当期的六篇亮点论文之一。在Science、PNAS等SCI收录的学术期刊和WWW、AAAI、SIGIR等本领域重要学术会议上发表论文50余篇,出版学术专著1 部。担任PNAS、IEEE TKDE、ACM TKDD等10余个学术期刊的审稿人,20余次担任WSDM、CIKM、ASONAM、ICWSM等学术会议的程序委员会委员。博士论文获得中科院优博、CCF优博提名。获得中科院院长特别奖,入选中科院青促会和中科院计算所“学术百星”计划,并被评为首批中科院青促会优秀会员。获得电子学会电子信息科学技术一等奖、北京市科学技术二等奖、钱伟长中文信息处理科学技术一等奖。
兰艳艳,副研究员,硕导,中科院青促会会员
研究方向:信息检索和机器学习
在排序学习方面,建立了排序学习的理论框架,连续在ICML2008,ICML2009,NIPS2009,NIPS2012和CIKM2013等顶级国际会议发表了一系列论文,为排序学习方向奠定了坚实的理论基石;提出了top-k排序学习框架,有效降低了排序学习所需要的高额标注代价,获得SIGIR2012年最佳学生论文奖;提出了基于序列关系的多样性排序学习模型,在ICDM2013,SIGIR2014和SIGIR2015持续发表论文,形成了国际领先的研究点;在深度文本表达方向,基于word2vec和深度学习技术,提出了文本表达和匹配的一系列新模型,论文发表于ACL2015,AAAI2016和IJCAI2016,在国内处于领先地位。近5年(2011 年至今)在国内外共发表论文36 篇,其中在本领域最有影响的国际会议SIGIR,NIPS, WWW,AAAI,IJCAI,ACL上发表论文15 篇,获2014年中文信息学会钱伟长中文信息处理科学与技术一等奖1项,入选中国科学院青年促进会会员。
欧阳文涛,副研究员,硕导,入选中国科学院百人计划
研究方向:互联网群体智能,社会计算,数据挖掘
于2011年在香港科技大学取得博士学位,2012至2015年先后在美国杜克大学和美国加州大学洛杉矶分校从事博士后研究工作。2017年6月Google Scholar引用量400余次,单篇论文最高引用量160余次。在计算机科学领域顶级国际期刊如IEEE Transactions onKnowledge and Data Engineering,IEEE Transactions onParallel and Distributed Systems,IEEE Transactions onMobile Computing,以及计算机科学领域重要国际会议如UbiComp,CIKM,IPSN上发表多篇高水平论文。
翟立东,副研究员,硕士生导师,大数据与信息安全组组长,中国网络空间安全协会理事,竞评演练工作委员会常务副秘书长,大数据安全人才培养基地负责人。
研究方向:大数据隐私保护和网络安全。
曾参与国家科技部十二五863信息技术领域“网络与信息安全”方向的科技战略规划,作为课题负责人承担国家科技部863重大课题2项、国家发改委、中科院战略先导专项、中科院重点项目等多项课题。作为课题负责人参与多项网络空间安全战略规划与研究,包括中国工程院重大咨询项目课题3项、中央网信办咨询课题2项。与腾讯、阿里巴巴、360等多家大型互联网企业网安部门有着良好的合作关系,负责指导组织XP靶场挑战赛、音视频分析大赛、XCTF、XNUCA等多项国家级网安竞赛,指导学生毕业去向为中科院计算所、信工所、移动研究院、腾讯、百度、IBM等。
刘盛华,副研究员,硕导
研究方向:情感分析、信息传播
围绕社会媒体情感分析和传播展开深入研究,发表第一作者论文12篇,在IEEE Trans on Knowledge and DataEngineering (TKDE), AAAI、IJCAI、CIKM、WWW、SDM、PAKDD、WI等领域认可度高的国际会议和期刊论文共发表13篇。形成的关键性技术申请并受理国家专利6项,以及美国专利局授权专利1项。目前是中文信息学会“社会媒体处理(SMP,Social Media Processing)”专委会委员;担任国际人工智能顶级学术年会AAAI2016、WAIM 2015、社会媒体处理大会SMP2014程序委员会委员;国际数据挖掘顶级期刊TKDE和TKDD、JCST、计算机学报等期刊审稿人;美国加州大学洛杉矶分校(UCLA)电子工程系学术界校友代表。
俞晓明,高级工程师,硕导,网络数据平台系统组组长
研究方向:大规模内容处理、Web搜索、文本挖掘、网络信息安全等
在国内外期刊和会议上发表论文30余篇。负责完成天玑分布式检索系统,以该系统为基础参加NIST(National Institute of Standards andTechnology)组织的TREC评测(检索领域最权威评测,吸引微软等全球知名研究者和知名机构参与),获 TREC 2011 Web Track 评测 adhoc 任务全球第1名。参与多项国家重大课题和项目,其中“社会化媒体数据的分析与检索”获2014年“钱伟长中文信息处理科学技术奖”一等奖;此外,参与项目获国家科技进步奖一等奖一次、二等奖两次。
许洪波,副研究员,硕导
研究方向:互联网搜索与挖掘、大数据分析与计算、自然语言处理等
作为负责人和主要成员先后承担国家973课题5项,863课题3项,国家科技支撑计划课题2项,国家自然科学基金重点课题1项、面上课题数项,国家安全重大专项2项,部委级横向项目多个。作为评测委员会联合主席成功组织了七届中文倾向性分析评测(COAE2008-2012、COAE2015-2016)以及倾向性评测研讨会。带领课题组先后获得TREC2002自适应过滤国际评测第1名,TREC2004新信息检测国际评测第1名,TAC2008自动文摘国际评测第1名,TREC2009命名实体检索评测并列第1名,TREC2010倾向性检索评测单项第一名等。获得2015年度北京市科学技术二等奖,2012年度国家科技进步二等奖,2011年度中国电子学会电子信息科学技术一等奖,2007年度武警部队科技进步二等奖,计算所2007年度优秀研究人员,2008年度曙光奖教金。多年来发表及合作发表学术论文100余篇,他引一千多次,申请专利19项,已授权7项,软件登记4项,培养和协助培养硕士、博士研究生40余名。
张瑾,高级工程师,硕士生导师,舆情系统组组长,舆情重大系统研制负责人、中科院计算所福州分所常务副所长。
研究方向:网络数据科学、网络搜索与挖掘、大规模分布式数据分析与处理架构等
长期以来专注于面向海量大规模文本信息的自动处理与智能分析,通过多渠道海量信息感知与获取、面向舆情事件的词法分析、大规模在线话题检测、分布式存储于调度算法等的研究,带领团队打造天玑舆情服务平台系统(YQ2.0系统),成功应用于国家多个战略性核心任务。曾获国家科技进步二等奖、电子学会科学技术一等奖,WJ科技进步二等奖等奖励,具有显著的社会价值和产业价值。
林思明,高级工程师,硕导
研究方向:网络信息安全、 云计算安全、大数据安全等。
近年来,作为科研骨干参与多项国家863、973、242等项目,其中包括:国家自然科学基金项目《大规模互联网网络行为测量和分析方法》、国家863项目《网络性能测量方法和系统》、《网络测量技术的研究》、《网络新业务流量分析、建模与 控制研究》、国家973项目《面向业务感知的网络测量理论与方法》、国家自然科学青年基金项目《高通 量网络仿真的弹性调度模型与方法研究》、国家互联网应急中心项目《云计算资源管理关键技术与系统研究》等,近年来在网络安全模拟与仿真领域相关杂志和顶级国际会议上发表学术论文11篇、申请专利8项。