作者 | Flavian Hautbois
翻译 | AI科技大本营(rgznai100)
上个月,我们发了很多文章。但是,机器学习和数据科学整个领域所发表的新文章更多。如何用一篇文章就能梳理好这些最新的内容呢?我们苦思冥想,从中找出了这十篇有关神经网络、TensorFlow、数据可视化、生成式对抗网络(GAN)以及LSTM的最佳文章。
我们先从下面的漫画开始:
图片翻译:
“这个问题已经困扰我们很多年了。”
“不用纠结,让我用算法来替你解决它。”
6个月后…
“哇,你这问题确实好难。”“你不是说……”
https://medium.com/@plotlygraphs/introducing-dash-5ecf7191b503
https://blog.sicara.com/compare-best-javascript-chart-libraries-2017-89fbe8cb112d/
Google公司一直致力于让大数据领域最新研究的实现变得更加简单。本月他们在TensorFlow上发布了用于目标检测的API,也发布了适用于移动设备的版本。
https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html
这是一篇介绍如何训练一个神经网络来生成手写数字图片的教程。我们很欣赏这种在对抗式网络这个新的研究方向上的实践技术,这又是一个在经典MNIST数据集上做的实验。在这篇文章中,你将得知训练生成式对抗网络是一件困难的事,是因为你需要在生成器与判别器的训练中找到平衡。本教程仅需要大概半小时就能读完,属同类教程中的佼佼者。
https://www.oreilly.com/learning/generative-adversarial-networks-for-beginners
受到最近图像方面研究的启发,文章作者尝试用低质量的音频文件来重构出分辨率更高的音频,最终音频质量上没有取得大幅度的提高,但也一定程度上达到了目的。尽管实验结果上的提升并不显著,我们仍然认为该篇文章为本月最佳文章之一。原因如下:
本文着重于重构VoIP语音,这点很巧妙。
语音方面的研究工作比较复杂,而深度学习技术的应用除了在语音转文本应用领域之外,其他的较少见到。
我们觉得如果作者在卷积网络中使用频谱表示而不是时间表示的话,实验结果还能再提升一步。
https://blog.insightdatascience.com/using-deep-learning-to-reconstruct-high-resolution-audio-29deee8b7ccd
如果你阅读了前面关于LSTM的文章,那么你已经看到了一个关于生成Java程序的例子。来自Thibault Neveu的这篇文章也在尝试做同样的事情。文中使用TensorFlow并且比之前的文章更易于上手,并且更适合做快速阅读。
这篇文章介绍了如何使用生成式对抗网络来生成新的抗癌药物,思路很棒。在制药研究领域有一个Eroom定律,与摩尔定律正相反(随着时间推移,寻找新药的难度呈指数增长)。Mostapha Benhenda强烈呼吁研究人员在大数据与药理学交叉领域上的研究采取行动。
https://hackernoon.com/make-pharma-great-again-with-artificial-intelligence-some-challenges-50e91ea9988d
注意到上面饼状图里一些奇怪的地方了吗?你应该注意到,不过你可能没有(至少我没)。这篇文章详细举例说明了用图表来做比较时的错误用法,从中你会学到在对比两种相似的数据时,图表展示的方式非常重要。
详见Andrew Gelman的原文
http://andrewgelman.com/2017/06/02/youll-never-guess-one-quick-trick-diagnose-problems-graphs-make-improvements/
Kaggle是一个数据科学方面在线竞赛平台。公司可以提交赛题以及相关数据集供参赛者解决。Kaggle是一个大型社区,你在上面有机会获得百万美金大奖。这篇文章的作者分享了他从开始时的新手到后来比赛取得第五名的经验。我们认为他总结的参赛小技巧也可供企业数据科学家参考,如果你想参与Kaggle上的竞赛,那么这篇文章将非常值得一读。
https://www.dataquest.io/blog/kaggle-tips-tricks/
最后再介绍一篇关于商业上Amazon收购Whole Foods超市的文章。随着大数据的研究逐渐渗透商界,我们认为这类文章是这个列表的重要补充。从企业获取数据的角度来看,Amazon收购Whole Foods超市是明智之举。因为Amazon虽然是个大公司,但是数量上远不及Whole Foods超市多,所以收购将为其带来巨大的数据财富。
https://blog.dataiku.com/big-data-is-the-big-news-in-amazon-whole-foods-deal
https://blog.sicara.com/06-2017-best-big-data-new-articles-this-month-5c3478872a61
专属福利:中国国内级别最高、规模最大的人工智能大会——中国人工智能大会(CCAI)将于7.22-7.23在杭州举行,目前大会 8 折 专属优惠门票火热抢购中,赶快扫描下方图片中的二维码或点击【阅读原文】火速抢票吧。
中国人工智能大会(CCAI),由中国人工智能学会发起,目前已成功举办两届,是中国国内级别最高、规模最大的人工智能大会。秉承前两届大会宗旨,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017)将于 7 月 22-23 日在杭州召开。
作为中国国内高规格、规模空前的人工智能大会,本次大会由中国科学院院士、中国人工智能学会副理事长谭铁牛,阿里巴巴技术委员会主席王坚,香港科技大学计算机系主任、AAAI Fellow 杨强,蚂蚁金服副总裁、首席数据科学家漆远,南京大学教授、AAAI Fellow 周志华共同甄选出在人工智能领域本年度海内外最值得关注的学术与研发进展,汇聚了超过 40 位顶级人工智能专家,带来 9 场权威主题报告,以及“语言智能与应用论坛”、“智能金融论坛”、“人工智能科学与艺术论坛”、“人工智能青年论坛”4 大专题论坛,届时将有超过 2000 位人工智能专业人士参与。
戳原文,抢 8 折优惠门票!