机器读心术之迁移学习

2018 年 1 月 16 日 炼数成金订阅号

过去10年，基于大数据基础实现“可微分编程”的深度学习技术红遍全世界，对AI技术发展起到重要促进作用。但深度学习涉及庞大的人工神经网络，待训练参数数百万计，要训练这样复杂的系统，训练数据也需要有相应的规模。像Imagenet比赛，图像识别涉及上千个分类，训练集和测试集包含数百万张图片，使用的典型网络结构，AlexNet，VGGNet，Inception等，需要训练的权值有数百万以上。即使对于互联网公司，要积累如此规模的数据，都是不容易的事情。对于广大中小企业，更是可望而不可及。空有漂亮的技术，却因缺乏数据而无法有效应用，这是企业在实施人工智能项目时普遍遇到的问题（例如，在医学影像处理领域，某些疾病几十年来积累的阳性样本也就几百张图片而已）。

当前，人工智能的竞争，正逐渐从算法模型领域的研发竞争，转向数据和数据质量的竞争，而算法的发展方向，则更趋向于不要求海量数据也能达到工业级精准要求，具有更高数据利用率的模型。“小数据学习”正在成为新的热点，以迁移学习，强化学习为代表的小数据学习技术，更能体现人工智能的未来之路。炼数成金在过去几年为人工智能技术的普及做了很多知识推动的工作，2018年，我们课程的主题将聚焦到“小数据学习”，围绕“知识图谱”“迁移学习”“强化学习”等领域展开人工智能线路的新课程，将制作一系列相关线上课程和地面课程，满足技术发展一线的需求，同时配合我们正在研发的智慧医疗领域，智能运维领域的各项产品，把算法模型技术与具体产品实践相结合，和大家一起为把我们国家的人工智能应用水平提升至世界一流水平而共同努力！

本门课程的主题是迁移学习，是指把从源领域某任务中习得的知识，迁移到目标领域另一任务中去，目标领域往往因为缺乏数据或其它资源而无法顺利完成机器学习任务。迁移学习体现了人类特有的类比能力，是“举一反三”式的发散思维。这也是在机器学习领域里少有的华人科学家占有统治地位的范畴。迁移学习已经广泛被使用在各种人工智能机器学习应用场景，但目前还不具备完整知识体系，还没有套路，仍处于case by case的散手阶段。目前也没有完整的教科书，各种知识，玩法伎俩散布在海量的论文，代码，案例里。本门课程梳理了迁移学习领域的知识要点，首次在中国开出成体系的专业课程，希望对一线工程师，算法设计师，架构师，解决方案提供者起到抛砖引玉的作用。让我们一起参悟“小数据学习”，将人工智能的潜力淋漓尽致地发挥出来。

课程大纲：

第1课小数据学习真正体现人工智能。迁移学习（transfer learning）概述，通过若干场景案例说明什么是迁移学习？迁移学习的类型和典型方法，适合使用迁移学习的领域。

第2课基于实例的迁移学习（1），KMM方法，应用场景：在不靠谱（采样有偏差）的样本集上训练和评估分类器

第3课基于实例的迁移学习（2），TrAdaBoost算法，应用场景：新闻文本分类

第4课基于特征的迁移学习，SFA方法，应用场景：电子商务评论的情感分析

第5课基于一般特征的迁移学习，TCA，应用场景：WiFi定位

第6课异构迁移学习，应用场景：跨语种的文本情感分析，自我特征学习

第7课基于参数的迁移学习，多任务特征学习，应用场景：考试分数预测，机器人动力设计

第8课关系迁移学习，二阶Markov Logic，RAP，应用场景：穿梭于蛋白质数据，网页数据，社交网络数据，难以想象的跨界深度迁移

授课时间：

课程将于2018年3月31日开课，课程每1-2周1课，持续时间大约为15周

授课对象：

具有一定机器学习基础，对人工智能应用落地，实践“小数据学习”技术有兴趣的朋友

收获预期：

对于怎样在现实（一般不会是很理想）的数据状况下，实现人工智能产品和展开数据分析，具有清晰的思路和熟练技巧，从入门级的数据分析师，人工智能算法设计师，解决方案提供者迈向高阶，晋身数据科学家和企业人工智能技术带头人级别的专业人才队伍。

授课讲师：

黄志洪（tigerfish），数据库专家，数据分析专家，有丰富的IT领域、数学领域的知识经验。知名数据库网站ITPUB创始人，知名数据分析网站炼数成金创始人。ITPUB在其十几年历史中为中国IT业特别是数据库行业输送了大量人才，其中不乏今天在行业里叱咤风云的佼佼者，因此被誉为数据库业的黄埔军校。后来创建炼数成金，言传身教，亲自讲授大数据，数据库，数据分析，人工智能等方面的几十门课程，本身也在华南著名学府中山大学任教多年，桃李满天下。引领无数弟子进入业界，朋友圈遍及业界重要人士，广受尊重。

点击下方二维码或阅读原文报名课程：