导语:漫漫科研路上,无数学者兢兢业业,勤恳向前。其中,女性投身科研的过程往往面临更大压力,但她们的故事依然动听,斑斓多彩。
近日,AMiner 团队推出 2022 年“人工智能相关领域全球女性学者”名录,以展现女性学者在人工智能科研领域取得的不俗成果,鼓舞更多年轻女性立志投身人工智能研究领域。学术头条此次有幸对入围这一名单的清华大学智能产业研究院教授兰艳艳进行了采访。
她温柔与爽朗并存,思考与行动齐举,从科学研究中嗅到蔷薇芳香,自传道授业中成就学子进步,这是兰艳艳的真实写照。回顾自己的科研之旅,她笑着说:“过往皆为序章,但路上的醉人风景早已镌刻而成。”
以数学为基点,转向机器学习
或许每位学者都对自己在科研道路迈出的“第一步”记忆犹新,当谈到过往成绩时,兰艳艳对自己科研之路上的两个“第一次”印象尤为深刻。
首先是在读博期间,彼时还是学生的兰艳艳发表了第一篇核心论文,这也是她从数学专业转向计算机领域的起点之作。回忆当时情境,她说:“从数学领域转向机器学习,有一定的必然性,也有一定的偶然性。”
2001 年,兰艳艳进入山东大学数学院就读本科,直到大三,她出于兴趣,选择了统计学这一应用数学领域作为自己的主攻方向,那时她还不知道,这一选择将奠定了自己后来与人工智能领域的不解之缘。
二十年前,国内许多非计算机领域的学者甚至未曾听过“人工智能”一词,兰艳艳也一样:“当时,我只是对应用数学非常感兴趣,比如应用统计学进行大气、交通、水资源统筹等。而数学要想做应用就离不开大型数据,因此,基于数据的计算非常重要。”
对统计学的钻研无疑为兰艳艳真正迈进机器学习领域打下坚实基础。2007 年,博士二年级的她进入微软实习,接触到了一个关于优化搜索引擎的合作项目。当时,搜索引擎的准确性普遍不够高,且在垃圾信息过滤方面的性能较低,导师们关于该项目的讨论为兰艳艳打开了“新世界”的大门:“信息的准确获取是一个具有急切应用价值、非常重要的研究。”
那么如何解决这一问题呢?兰艳艳瞄准排序算法泛化能力的提升,以“每天都很兴奋”的状态一头扎进这个全新的领域。她与团队同学日以继夜地奋斗了三个月,最终提出了一种新的信息检索概率排序公式,这也是关于学习排序算法的查询级泛化能力的首次研究。
(图 | 该工具在两种算法上应用后得到的准确率,来源:https://www.aminer.cn/pub/53e9ade9b7602d97037f32f1)
最后,这篇题为“Query-Level Stability andGeneralization in Learning to Rank”的论文顺利发表在机器学习领域顶级会议 ICML 之上,成为兰艳艳在机器学习领域的起点之作:“这项工作让我第一次真切体会到做研究的充实感和幸福感,也极大地激励了我持续地做研究——遇到新问题并产生好奇心,提出方案、解决问题、看到结果,这是一个不断迭代的过程。”
走过荆棘,看到玫瑰
如果说第一次发表自己的论文是兰艳艳学术生涯的起点,那么第一次指导学生顺利发表论文则是她教师生涯的起点。
2011 年,兰艳艳获得博士学位并进入中科院计算所继续探索科研。但转变是显而易见的——她不再是学生,而是成为老师,担起“传道授业解惑”的责任,“像一根拐杖,要带领年轻人朝着正确的方向前行。”
谈到角色上的转变,兰艳艳更多地是欣慰:“我很喜欢当老师的感觉,可能我性格中有适合做老师的特点,我觉得成就别人是一件很幸福的事!当看到这些年轻的生命一步步地成长起来,这一过程中还有自己的参与,我感到高兴且幸运,这些回忆对我来说也非常珍贵。”
她相信,老师和学生也是相互促进、共同成长的关系。“在学术研究中,老师固然更有经验、能够提供很多帮助和引导,但学生们也会迸发新想法、新角度。老师也要思考如何用合适的方式与学生沟通,一起扬长避短,共同进步。”
而对于当前学生们进入科研领域时常常遇到的困惑,兰艳艳也给出回答:“科研之路看起来铺有荆棘,但当你勇敢跨过小小的刺,就一定会摘到玫瑰。”
第一,打好基础很关键。“基础知识就是修筑‘科研之屋’的地基,因此在早期学习中把知识学透很重要。今天我们常说‘AI for everybody’,尤其网络上有很多偏应用的学习资源、工具包等,也许不需要了解很多基础知识人们就能够做出 AI 应用。但如果想把科研做好,训练扎实的逻辑思维必不可少。”
第二,不要过早进入太窄的领域。在打基础阶段,兰艳艳一直希望学生能够打开思路,多多了解各种相关主题,“厚积才能薄发”。
第三,做研究需要务实精神。“真正进行一项研究工作时,每一个步骤、每一个环节都不可或缺,失之毫厘就会导致差之千里。因此,深入且专注地做事才能做出成绩。”
科研之路,永无止境
十五年科研之旅,也让兰艳艳也充分感受到了科研的魅力。尤其是在计算机领域,她见证了国内AI研究的起点和如今的繁荣景象。谈到这一领域的发展,她用“两面性”来概括。
“今天,人们对这一领域的关注大大加速了‘AI 无处不在’的发展趋势。以前可能两三年才能达到的一个技术迭代,现在可能一两个月可以完成。而且各个领域之间的交叉融合也发展迅速,更有利于推动技术在实际生活中产生更强的影响,这是一种良性的科研景象。”
另一方面,兰艳艳坦言“压力也会随之而来”。十多年前初入机器学习领域之时,她身边许多同学、老师都有诸如“机器学习是什么、机器怎么能学习”等等疑问,而现在,需要解答的问题则更加复杂、研究节奏也较快。
“但我们应该将压力转化为动力和督促。回望过去,虽然有困难、有沉闷,但我最大的感受还是幸运——科学研究是没有止境的,它永远可以突破人们的想象,正是这种无止境的魅力促使我保持初心,让自己沉淀和踏实下来。”
那么面对日新月异的科研环境,如何保持不断探索的热情呢?对此,兰艳艳给出两点建议:
第一是要培养自己独特的科研品味。“每个人的精力是有限的,因此培养独特的科研品味很关键。什么问题是有价值的、用什么方式去解决对应问题,每个人都会有不同的见解,但良好的科研品味能够像灯塔一样起到指引作用。”
第二是考虑个人特点与优势。每个人的特质各不相同,对这一点,兰艳艳深有体会:“我以前是数学专业的学生,所以可能在理论推导和建模方面的能力较强,因此我选择的第一个研究问题其实就是对算法背后理论的优化。发扬自己的优势,也更容易产生成就感,良性循环由此而来。”
第三要勤奋,注重长期的训练。“对研究人员来讲,以兴趣为出发点去做科研,这是肯定的,但仅仅靠兴趣来维持是不够的。科研过程中的辛苦和枯燥有时会让人产生迷茫情绪,这就要求我们具有百折不挠、打倒再爬起的精神。此外,保持时刻学习的心态也是跟上科研环境变化所必需的品质。”
正是因为这些品质,让兰艳艳不为女性学者的标签所束缚,尽管女性在科研过程中可能遇到的困难更多,但她始终相信,“从结果上看,科研之路,没有性别差异。我相信科学研究有了大家的努力,无论男性还是女性,未来都会散发更耀眼的光芒!”
个人简介:
兰艳艳,现任清华大学智能产业研究院研究员/教授,此前曾在中国科学院计算技术研究所任研究员,她研究的领域为信息检索,机器学习和自然语言处理,在人工智能和机器学习领域重要国际期刊和会议上发表论文 80 余篇。2012 年获得 SIGIR 最佳学生论文奖,2017 年获得 CIKM 最佳论文 Runner-Up 奖。入选中国科学院青年创新促进会优秀会员,北京市智源人工智能研究院青年科学家,获得中文信息学会钱伟长中文信息处理科学技术奖一等奖。
l 个人主页:
https://www.aminer.cn/profile/yanyan-lan/53f48107dabfaee43ed5798c
l 清华大学智能产业研究院智慧医疗团队必读论文:https://www.aminer.cn/topic/624185327376380a6ab8f2de
点击【阅读原文】了解更多关于 Women in AI 的完整内容:
https://www.aminer.cn/women_in_ai
热门视频推荐
更多精彩视频,欢迎关注学术头条视频号
winter
【学术头条】持续招募中,期待有志之士的加入