近期,教育部、国家语委公示了“中国语言资源保护奖”评审结果,全国共表彰了20个先进集体和100位先进个人。其中,清华大学计算机系荣获“中国语言资源保护奖”先进集体称号,清华大学计算机系李涓子教授荣获“中国语言资源保护奖”先进个人称号。
李涓子,清华大学计算机系教授,博士生导师。中国中文信息学会语言与知识计算专委会主任、中国计算机学会术语委员会执行委员。研究兴趣是语义Web,新闻挖掘与跨语言知识图谱构建。多篇论文在重要国际会议(WWW、IJCAI、SIGIR、SIGKDD)和学术期刊(TKDE、TKDD)上发表。主持多项国家级、部委级和国际合作项目研究,包括国家自然科学基金重点项目、欧盟第七合作框架、新华社项目等。获得2011年王选新闻科学技术进步一等奖、2013年人工智能学会科技创新一等奖、2017年北京市科技进步一等奖等。
中国语言资源保护工程由教育部、国家语委自2015年启动,是目前世界上规模最大的语言资源保护项目。该工程旨在贯彻党和国家大力推广和规范使用国家通用语言文字及科学保护各民族语言文字的指示要求。五年来,全国数百所高校和研究机构的千余名专家学者共组织完成了1500个调查点项目,并取得了一系列突破性进展,为服务国家发展需求发挥着重要作用。
在教育部语信司和中国语言资源保护研究中心的领导下,清华大学计算机系于2015年启动了以李涓子教授为带头人的课题组建设“中国语言资源采录展示平台”的项目。该平台可保存和管理大规模汉语方言和少数民族语言调查点采集的珍贵多媒体数据,并利用科学化、规范化和具有前瞻性的计算机科学技术手段,完成所有语言资源的数字化、存储管理、整理分析和应用展示等方面的工作,建设成大规模、可持续增长的多媒体语言资源库。
目前,已经有34个省市,1453个语言资源调查点的数据资源进入了语言资源数据库,社会化采集资源超过4000条,音、视频资源的数量分别达到486万和315万条,数据总容量超过54TB,并且还在持续增加中。平台对于全面提升我国语言资源保护和利用的水平,传承中华优秀传统文化、促进民族团结、维护国家安全服务等具有重要意义。
在此次疫情中,课题组还在教育部语信司指导下,协同北京语言大学语言资源高精尖创新中心等10余家战疫语言服务团成员单位,充分发挥多年来在语保工作中积累的技术和资源基础,研发出“抗击疫情湖北方言通”微信版。
“抗击疫情湖北方言通”音频播放量数据统计
众所周知,湖北是多方言区,在战疫一线,患者和援助湖北的外地医生难免存在一定的语言沟通障碍,在实际应用中,“抗击疫情湖北方言通”切实解决了这一难题。截止上周,该系统累计用户访问量超3.1万人次,音频播放总量超38.6万人次,有效地支撑了抗疫前线的语言服务工作,证明了语保工程工作对包括应急响应处置在内的国家和社会建设的积极作用。
素材:张鹏
整理:张超
总审核:贾珈