机器学习六步曲——“小马医生”养成记

2017 年 8 月 3 日 机器学习研究会

编者按：近年来，机器学习和大数据领域的突破进展使人工智能急速回温，训练计算机模拟甚至实现人类的学习行为则是目前人工智能领域最受关注的研究课题之一。很多人都难以想象，看似冷冰冰的机器如何能在短时间内学得一身本领的？其实，培养计算机具有一定的专业能力与培养一个专业人才的过程具有很多相似性。微软亚洲研究院资深研究员闫峻博士撰写本文，通过“小马医生”成长的例子，带你破解机器学习的神秘过程。

计算神器，天资超凡

老马有一个小儿子叫小马，他非常可爱，且拥有超乎常人的记忆力，基本过目不忘。小马的算数能力同样惊人，各种加减乘除，非一般儿童可比。经过儿时的培养和精心呵护，老马惊喜地发现自己的孩子还耳聪目明，听写考试成绩永远名列前茅，对所看到事物的辨识力也十分了得。老马总是骄傲地和朋友们说：“我的孩子是个小天才，小小年纪已经学会好几种语言了，我们全家出国旅游，他都可以当个小翻译了。”就在前几天学校的下棋比赛上，小马轻轻松松拿了第一名。于是，老马决定，要好好培养这个孩子。

机器学习小课堂

计算机与人类相比有很多先天的优势。比如记忆能力、基本运算的速度等方面都是正常人类所无法比拟的。随着人工智能技术的发展，计算机在感知计算如语音识别、图像识别等领域的能力也已经开始赶超人类。在基于大数据的机器翻译，以及基于搜索算法与增强学习的棋类竞技上，计算机也表现出了强有力的竞争力。于是，人们期望计算机能做的更多、更好。虽然计算机有先天的优势，但自身仍有不足。在努力了解计算机并帮助这个 “天才儿童” 成长的过程中，我们是否可以利用一个或多个具体的应用领域来更好地认识“他”并更有效地挖掘“他”的潜力呢？因此，我们计划从一个小目标开始，看看计算机能不能成为一名称职的人类医生助手，甚至未来是成为一名医生。

知识工程，美中不足

小马果然没有辜负家人的期望，以优异的成绩考入了全国知名的医学院。在学校里，小马认真阅读了大量书籍和文献，知识积累越来越丰富。眼看大学就要毕业了，小马被派到一所知名医院进行实习。凭借自己的知识积累，小马决定一展身手。可是当小马到了医院见到了形形色色的患者后，他发现书本里学到的知识有点不太够用。患者对症状的含糊描述让他不知所措。而且很多患者的现实情况和书本里讲的经常不太一样，总是多出或缺少几个他没见过的特殊症状表现，所以小马没办法用他在学校里学到的知识严谨的推理出合理的结论给患者。这让小马感觉挫败，他觉得自己的知识零散，不灵活，于是他决定回到学校继续读研深造。

读研期间，小马勤学好问，把他遇到过的、不知道如何解决的问题归纳总结起来，向导师询问，学习到了很多书本里学不到的新知识。他意识到：要成为一名好医生，不能光靠书本知识，经验也很重要。研究生毕业后，小马如愿以偿加入到他实习时的这家知名医院成为了一名医生，并开始积累他的临床经验。

机器学习小课堂

知识工程是早期人工智能技术关注的焦点。知识的提取、知识的表示与推理曾被认为是人工智能的基础。但在应用的过程中，人们逐渐发现高质量专业知识抽取的成本很高，也很难做到完备，知识的表示也很难做到易用的语义层面，这一切都给知识推理带来了巨大的挑战。这些挑战所带来的后果就是人们发现在很多应用领域单纯依赖于知识工程的方法成本高，也难以达到预期的效果。因此，人们开始对知识工程产生质疑，甚至对人工智能产生质疑。

转自：微软研究院AI头条

登录查看更多

相关内容

闫峻

关注 0

闫峻，医渡云首席AI科学家，中文信息学会语言与知识计算专业委员会委员、中文信息学会医疗健康与生物信息处理专业委员会委员。曾担任微软亚洲研究院任资深研究经理、微软北京大学联合实验室副主任、CCKS工业论坛主席、中山大学博士生导师、人民大学工程硕士导师及人工智能领域多个顶级国际会议程序委员会委员。主要从事大数据与人工智能等相关工作。

【干货书】Python统计学分析应用，285页pdf讲述在生命科学领域的应用

专知会员服务

142+阅读 · 2020年6月2日

商业数据分析，39页ppt

专知会员服务

165+阅读 · 2020年6月2日

【ICMR2020】持续健康状态接口事件检索

专知会员服务

18+阅读 · 2020年4月18日

简明扼要！Python教程手册，206页pdf

专知会员服务

48+阅读 · 2020年3月24日