作者简介
王庆法,数据领域专家,首席数据官联盟专家组成员,曾就职于IBM、微软等知名企业的研发部门17年,在传统企业数据、大数据、机器学习、深度学习以及云计算等领域积累了丰富的软件开发、架构设计、技术管理、产品创新以及孵化落地的经验。
一个人之所以有信仰,是因为他被洗脑了(One believes things because one has been conditioned to believe them)
-- 阿道司·赫胥黎
基因编辑
赫胥黎眼中的未来,人类实现了差异被认同,工作无疲惫,幸福触手可及的《美丽新世界》。在那里,基因培育消除了人的差异,仅为不同阶层与工种设计了少许的多样性。一切都是一劳永逸,你不再需要“对家眷恋、对爱忠诚、对死恐惧、对生命敬畏,对不如己意的一切抱有怀疑,对难测不定的命运痛苦感伤”。
这或许是人类社会的终极的乌托邦形态。人类已经无限接近掌握基因编辑与培育的技术,上个月名为露露和娜娜的基因编辑女婴的健康出生,哗然全球。亲代与子代间由DNA双螺旋所缠结起来的传承,与自然赋予的形形色色的变异可以被掌控了吗?数十亿年“物竞天择”的终极在哪里,人类掌控下的遗传变异是否能够选择出超级赛亚人? 什么才是未来可以“生存”的“适者”?赫胥黎在焦虑,社会在焦虑,孩子的家长也在焦虑。
托马斯.赫胥黎把进化与遗传的整合称为综合进化,种群中不同个体得到不同的遗传材料,同时在繁育能力上表现出差异。变异发生在代际,驱动因素来自遗传物质重组、突变、流动、漂变,为自然选择提供可能。变异表现出明显的随机性,无既定方向,由环境适应度(Fitness)决定。选择的是个体,进化的是种群。这一点或许可以解释为啥学霸父母可能生出学渣娃,而下一代情商智商整体看来都优于双亲一代。人工基因编辑带来的社会焦虑,源于这些新基因有没有机会发生漂变,从而影响人类的整体基因库。
神经进化
一石激起千层浪,围绕生物学意义上的基因编辑、遗传掌控的争议仍在继续,而模拟生物进化自然选择与遗传机制的计算模型--神经进化( Neuro Evolution ),却开始展现出强大的潜能,强大到可能主宰当下流行的深度学习与人工智能的未来发展方向。未来已来,将至已至,只是分布不均。
“神经进化是人工智能和机器学习的一个分支,通过在计算机中激发一个类似人类大脑进化的过程,找到进化人工神经网络(ANN)的途径。”Kenneth Stanley 教授2017年在《神经进化:一种不同的深度学习 (Neuroevolution: Adifferent kind of deep learning)》演讲中如是说。神经进化就是用进化算法生成神经网络,探索优化网络的架构、参数、拓扑以及规则,为困扰ANN的局部最优、梯度依赖、规模并行、架构自动化等问题,找到有效的解决方法。
在喜欢画个圈把自己圈住,然后定义自己在圈外的数学家看来,问题是这样的:给定黑盒场景,在连续空间里最大化适应度函数 F(Fitness function)。这与大部分的现代神经网络利用香农的信息熵构建的深度学习损失函数,看起来大不同。F 可以是非线性、非凸、多模、非平滑,甚至不连续、病态、有噪音的,因而 F 很可能存在多个局部最优,不可求导,这些都是依赖梯度下降后向传播的神经网络模型参数优化的禁区。
对的,他可能长成这样:
进化策略
ANN 神经进化的思想很简单:让ANN 繁衍后代,这是生物遗传进化的核心。首先产生一个随机的ANN种群,为每个ANN个体初始化一个参数 θ,θ随机分布,θ就是ANN的基因;接着根据实际场景,定义一个适应度(Fitness),这一步至关重要,例如你在训练ANN来控制游戏中的角色,你需要知道这些ANN在操控游戏角色时的表现如何,并且可以打个适应度的分;然后让这些ANN个体一个个来操控游戏角色,并且打适应度分,不必担心他们的拙劣表现,只管给他们的适应度评分排排队,选出其中表现稍好一点点的作为新一代的ANN父母;通过相应的进化策略(Evolution Strategy)修改这些新一代的ANN的基因θ,类似自然界中的“重组、突变、流动、漂变”,产生他们的后代;然后让这批新的后代操控游戏角色,并做适应度打分,周而复始,直到你满意。
生物学家说,这不是什么遗传进化,这太抽象、太简化,远远不能模拟自然界的生物种群繁衍,脑科学家当初也是这么评价人工神经网络的。数学家说,这不过是一个用途更广泛的优化过程,不吹不黑。进化策略与遗传算法都是典型的神经进化算法,不同于遗传算法的二进制基因表达,进化策略用实数值描述基因,按既定要求生成一定数量的候选个体,通常从一个概率分布中抽样而来,分布函数的参数在下一代的繁衍时被更新,过程可以描述为:
初始化随机参数分布θ,设定种群大小为λ,如果没有结束,就重复下面的步骤:
1. 分布采样
2. 适应度评分
3. 更新参数
简单的进化策略,可以直接从一个均值为 m、标准差为σ 的正态分布中抽样, 以C为协方差矩阵,可以表示为 :
又见正态分布,为什么数学家们如此钟情于它?赫胥黎说,如果你与众不同,你就一定会孤独。数学家们是每一代遗传进化智商方向的优势种群,因而其对正态分布在自然界中无时不有又无处不在的事实,以及正态分布遵循自然规律最大熵分布的物理意义,都有深刻理解。请参考本人《薛定谔的佛与深度学习中的因果》一文。
CMA-ES
简单的进化策略,标准差参数固定,仅适用于一些简单的场景,很容易陷入局部最优的陷阱。一念天堂,Nikolaus Hansen教授灵光一闪,协方差矩阵自适应进化策略(Covariance-Matrix Adaptation Evolution Strategy,CMA-ES)应运而生,这是数学界“基因突变”的实例之一。
Hansen教授引入了修正简单进化策略中的协方差矩阵C的方法,计算整个参数空间中的协方差矩阵,自适应的调整参数m与 σ;复用每一代的优选结果,自适应的调整下一代的可搜索空间。自适应遵循了逼近预期的适应度函数的自然梯度,并且提升了优选代的似然(Likelihood)。这让 CMA-ES 算法成为最流行的无梯度依赖的优化算法之一。
算法中的yw部分很有趣,协方差矩阵C的特征向量事实上是参数基因突变椭球体的主轴,具备旋转不变性,这等同于对yw做了主成分分析(Principal Component Analysis, PCA)。我在《迷人的数据与香农的视角》中解释的矩阵的奇异值分解 UEV' ,读者还有印象吗?
美丽新世界
2017年被认为是神经进化复兴的元年,OpenAI 与 Uber都发布了进化策略的研究进展,这些研究表明进化策略不仅在监督学习中取得了良好效果,在强化学习中也表现卓越,某些领域中可媲美最先进水平,甚至有所超越。早在2013年进化算法就在Pong、Breakout和Space invader等街机游戏中完胜人类,彰显无限潜力。谷歌大脑也发布了进化深度网络架构的大规模试验,MIT、约翰霍普金斯,卡耐基梅隆等高校均已开始聚焦。ANN的美丽新世界要到来了吗?
可是赫胥黎还在焦虑,他焦虑“物竞天择”的进化策略的终极目的地是何方;社会还在焦虑,他们焦虑有违社会伦理的疯狂科学家,给早已习以为常的“适者生存”的人类进化带来的新型的潜在的社会不公;家长们还在焦虑,她们焦虑人类社会进化的适应度(Fitness)函数唯一地变成了奥数成绩,“但我不要舒适。我要神,我要诗,我要真实的危险,我要自由,我要善良,我要罪孽”,这些其实都可以不要,我只要奥数成绩。许多培训机构还在不断助长这种焦虑。
“在病态社会中,精神病人才是真正健康的人”,“人们感到痛苦的不是他们用笑声取代了思考,而是他们不知道自己为什么笑以及为什么不再思考”,“我们常常抱怨这个社会的不公平,而家长们常常就会说这个社会就是这样,你必须要去适应。很多东西我们选择逃避,很多东西我们却选择冒险”。“缓慢地,非常缓慢地,像慢条斯理的圆规的脚,那两条腿向右边转了过来,向北,东北,东南,南,西南转了过去,停住,悬了一会儿,又同样缓慢地向左边转了回去,西南,南,东南,东……”。
参考资料:
·https://blog.openai.com/evolution-strategies/
·https://eng.uber.com/deep-neuroevolution/
·https://www.oreilly.com/ideas/neuroevolution-a-different-kind-of-deep-learning
·http://www.lorentzcenter.nl/lc/web/2008/305/presentations/Hansen.pdf
·https://arxiv.org/abs/1703.03864
·http://blog.otoro.net/2017/10/29/visual-evolution-strategies/
·http://jmlr.org/papers/volume15/wierstra14a/wierstra14a.pdf
·http://www.wenzhangba.com/duhougan/201804/269708.html
·https://www.juzimi.com/article/22470
END
∑编辑 | Gemini
整理 : 算数君
更多精彩:
☞ 曲面论
算法数学之美微信公众号欢迎赐稿
稿件涉及数学、物理、算法、计算机、编程等相关领域,经采用我们将奉上稿酬。
投稿邮箱:math_alg@163.com