简介: 许多人工智能任务需要跨域决策。例如,许多NLP任务涉及跨多种语言的预测,其中不同语言可以被视为不同的领域;在人工智能辅助的生物医学研究中,药物副作用的预测通常与蛋白质和生物体相互作用的建模并行。为了支持机器学习模型来解决这类跨域任务,需要提取不同域中数据组件的特征和关系,并在统一的表示方案中捕获它们之间的关联。针对这一需求,表示学习的最新进展往往涉及到将不同域的未标记数据映射到共享嵌入空间。这样,就可以通过向量配置或变换来实现跨领域的知识转移。这种可转移的表示在涉及跨域决策的一系列人工智能应用中取得了成功。然而,这一领域的前沿研究面临着两大挑战。一是在学习资源很少的情况下,有效地从特定领域提取特征。另一种方法是在最少的监督下精确地对齐和传输知识,因为连接在不同域之间的对齐信息常常是不足的和有噪声的。在本教程中,我们将全面回顾可转移表示学习方法的最新发展,重点是针对文本、多关系和多媒体数据的方法。除了介绍域内嵌入学习方法外,我们还将讨论各种半监督、弱监督、多视图和自监督学习技术,以连接多个特定域的嵌入表示。我们还将比较域内嵌入学习和跨域对齐学习的改进和联合学习过程。此外,我们将讨论如何利用获得的可转移表示来解决低资源和无标签的学习任务。参与者将了解本主题的最新趋势和新挑战,获得现成模型的代表性工具和学习资源,以及相关模型和技术如何有利于现实世界的人工智能应用。
主讲人简介: Muhao Chen,博士后。他于2019年获得加州大学洛杉矶分校计算机科学博士学位。他的研究重点是结构化和非结构化数据的数据驱动机器学习方法,并将其应用扩展到自然语言理解、知识库构建、计算生物学和医学信息学。特别是,他感兴趣的是开发具有概括性且需要最少监督的知识感知学习系统。他的工作在主要会议和期刊上发表了30多篇文章。他的论文研究获得了加州大学洛杉矶分校的论文奖学金。个人主页:https://muhaochen.github.io/等