分享主题
结构化数据的非监督特征学习:理论,算法,及应用(Unsupervised Feature Representation Learning via Random Features for Structured Data: Theory, Algorithm, and Applications)
分享背景
多数标准的机器学习模型在设计时都把向量形式的特征表示作为输入。而对于许多结构化的输入,比如时间序列、字符串、直方图、图,由于数据中并没有显式的特征,所以有许多研究都希望可以为这些复杂数据开发出有效的表示。尽管深度学习模型如今已经取得了巨大的成功,我们仍然希望设计一种一般化的方法,从结构化的“无标注”数据中直接学习到特征表征。演讲中我们将首先介绍 D2KE,这是一个可以从任意距离学习到核和它的表征的一般性框架。接下来我们将展示如何把 D2KE 用于从多元时间序列中学习嵌入(来自 AIStats 2018 的 oral 论文)。最后,我会讲解如何用 D2KE 从预训练的词表征中学习通用的文本嵌入(来自 EMNLP 2018 论文)
分享嘉宾
吴凌飞,IBM全球研究院总部(IBM T.J. Watson Research Center) 研究员 , 威廉玛丽大学计算机系博士,主要研究方向为机器学习,深度学习,表征学习,自然语言处理,大数据。吴博士已经发表20几篇顶尖杂志和会议,包含但不局限于KDD, ICDM, AISTATS, EMNLP, AAAI, ICASSP, SC, SIAM Journal on Scientific Computing, IEEE Transaction on Big Data, and Journal of Computational Physics。
吴博士同时也是13项美国专利的发明人。吴博士长期担任其相关研究领域多家国际顶尖杂志的评审,比如SIAM Journal on Scientific Computing, SIAM Journal on Matrix Analysis and Applications, IEEE Transactions on Parallel and Distributed Systems, IEEE Transactions on Knowledge and Data Engineering, IEEE Transactions on Big Data, ACM Transactions on Management Information Systems, Data Mining and Knowledge Discovery, Pattern Recognition, and Future Generation Computer Systems。
吴博士同时担任了 IEEE Big Data'18 Tutorial Co-Chair (讲座主席), 并长期担任AI/ML/DL/DM国际顶会的TPC (技术委员会委员), 如ICML'19, ICLR'19, WSDM'19, ACML'18, NIPS'18, ICML'18, IJCAI'18, KDD'18, ICDM'18, ICASSP'18, AAAI'18, WSDM'18, ICDM'17, IJCAI'17, BigData'17, KDD'17, AAAI'17, ICSSAP’17, and BigData'16。
分享提纲
结构化数据非监督特征学习的重要性和挑战。
宏观上介绍我们提出的结构化数据非监督特征学习的通用框架:D2KE (Distance to Kernel and Embedding)
重点介绍D2KE在两个领域产生的新方法,多变量Time-Serie非监督特征学习(Wu et al., AIStats'18, oral paper),和 Texts非监督特征学习(Wu et al., EMNLP'18)。
分享时间
(北京时间) 01 月 07 日 (星期壹)晚上 20:00
错过直播不要紧,回放视频上传后也能看哦~
直播链接
http://www.mooc.ai/open/course/627
↘ 扫码直达 ↙
【AI求职百题斩 - 每日一题】
来看看今天的题目吧!
想知道正确答案?
点击今日推文【第三条】即可答题获取!
点击 阅读原文 查看本文更多内容↙