崛起的猩球上到底能不能有会说人话的猴子?

2017 年 9 月 18 日 中科院物理所 氪罗钡路斯

与人类同属灵长目的猿与猴可以算是地球上除了人类以外大脑最发达、智商最高的生物之一了。那些在动物园中落寞独坐,或者在温泉里悠然自乐,又或者,在山林间剪径夺包还对着一脸悲愤的人类露出“你们都是渣渣”般嘲笑的猿猴,似乎距离人类就只有开口说一句话的距离。在科幻电影《猩球崛起》系列中,一只名叫凯撒,从母亲身上遗传了药物作用的黑猩猩,就神智全开,用一口六级水平的英语震慑了人类。然而现实之中,真的有猿猴能够学会说话吗?

 

出于各种各样的原因,让猿猴学习与人类交流的尝试与试验并不罕见。然而至今为止, 最成功的结果,也只是手语交流。比如美国加州一只名为Koko的大猩猩,她掌握了一千多个单词,能够表达抽象感情,甚至有两只属于自己的宠物猫。然而,她从来没有开口说过一句话,似乎较之人与猿猴之间思维上的差距,“说话”才是一道难以跨越的壁垒

 

尼姆•齐姆斯基(Nim Chimpsky)也是著名的“会说话”的猩猩。但研究人员仍然无法教会它发出人类的声音语言,只能让它跟着学习肢体语言。图片来源:DailyMail

 

猿与猴不会说话的原因是什么呢?科学界对此的解释一直分为两个流派,从达尔文时代争论至今,谁也没能说服谁。

 

早期的学者,包括达尔文,倾向于认为大脑的限制决定了猿猴不可能学会像人一样说话,它们并不能够自主控制声道肌肉的收缩,因而不能像人类一样灵活地发出各种声音。而1969年起,Lieberman等人的实验则逆转了舆论,提出声带的解剖学构造才是导致了猿猴不会说话的关键因素[1]

 

管风琴奏出的音符高低是由音管的形状与长度所决定,生物声道的发声原理也与此类似。因此,Lieberman 等人对一只刚刚死亡的普通猕猴(就是恍恍惚惚恒河猴里的恒河猴)进行了口腔石膏灌注,获取了猕猴声门至嘴唇的距离,然后将石膏模型切成薄片,通过薄片的重量估算了猕猴口腔内不同截面的面积。基于对猕猴口腔形状的计算,Lieberman等人认为猕猴的声道并不足以让它们发出某些元音,例如/a/, /i/与/u/——这些元音也恰巧是大部分人类语言所共有的元音[1]。稍后,Lieberman等人利用相同的方法在大猩猩身上重复了这个实验[2],得到了与猕猴实验一致的结果。

 

然而,依然有学者认为,将猴子的“失语”归结为声道构造过于武断。就像达尔文指出的——自然使用越多,发声器官就会越发强大与完善。但是显然,大脑的进化对于语言的使用更加重要[3]。2016年,Ghazanfar实验室发表在Science Advances上的研究公然与Lieberman一派叫上了板[4]。Ghazanfar实验室指出,Lieberman等人用一只不知道怎么被摆弄了的死猴子就得出了结论,实在是误猴子弟啊[5]!Ghazanfar实验室的研究则采取了一种与Lieberman类似,却更为“全面”的方法——X光活体成像。在这个研究中,实验人员捕捉了活体猕猴发声、进食、吞咽以及做出咂嘴、呲牙等动作时的声道X光影像,手动提取了99组声道轮廓构象。利用与Lieberman实验相似的算法,通过计算机程序,研究人员就预测出了这99组声道构象所能实现的发音空间(phonetic space) 。


 Ghazanfar实验室提取出的声道构象之一。A: 一只正在发出威胁性吼叫的猕猴的X光图。B: 轮廓提取。红线为声道轮廓。 图片来源: 参考文献[4]

 

人类说话或唱歌产生的声音包含许多不同的频率,共振峰(即发出声音时可以被作为特征识别的关键频率)是使听者能够区分元音的关键泛音[8]。Ghazanfar实验室的研究结果显示,猕猴的发音空间并不像Lieberman 五十年前用石膏模型预测出的结果那么悲观,猕猴的元音共振峰空间图谱倒是与人类女性有很大一部分重叠。


共振峰比对图谱。其中,红线轮廓为人类女性元音共振峰空间,灰线轮廓为Ghazanfar组实验得到的猕猴元音共振峰空间,蓝线为Lieberman文章中提出的猕猴元音共振峰空间。两组图谱中,横轴均为频率最低的共振峰频率,左图纵轴为频率第二低的共振峰频率,右图纵轴为频率第三低的共振峰频率。猕猴的元音共振峰图谱倒是与人类女性有很大一部分重叠。图片来源:参考文献[4]

 

为了进一步验证这一研究结果,Ghazanfar 实验室从电脑计算得出的猕猴发音空间中提取出了五个元音音素,并邀请了40位人类来测试他们能否分辨出这些电脑模拟出的“猕猴”所发出的元音。测试结果达到了90-98%的正确率,证明了“猕猴”的声道可以清晰地表达出英语中的不同元音。

 

同时,实验室的研究人员还利用猕猴的发音空间生成了“Will you marry me?”的句子,与人类的声音相比较,二者的频率图像倒也有几分相似相似。寂寞的小伙伴们也可以去听一听二者的音频版对比,看看到底是猕猴的声音还是人类的声音让你情不自禁地回答了 Yes.





Ghazanfar实验室进行比对实验时用的“Will you marry me?”音频。第一个是人类女性的声音,第二个是电脑模拟猕猴发出的声音。两段音频用相同的噪音源进行了技术处理 。音频来源:参考文献[4]

 

人类与“猕猴”表达“will you marry me?”时的声波频谱对比。上图为人类版本,下图为“猕猴”版本,横轴为时间,纵轴为声波频率。图片来源: 参考文献[4]

 

然而,这一系列实验并没有说服Lieberman。在2017年的Science Advances上,Lieberman 公开提出了几点质疑[6]。例如共振峰图谱恰巧说明了猕猴并不能很好地发出/a/, /i/ 及/u/三个元音;人与猕猴的“Will you marry me?”也只是轮廓相似——所以Ghazanfar的研究只不过是重复了他五十年前的结果而已。至于40个被试者参与的元音识别实验,看似统计正确,却只能唬住外行——二十世纪五十年代贝尔实验室就做过70位被试参与的、上万次元音识别测试。在那次测试中,一些元音的识别正确率可以达到99.98%[7],完胜“猕猴”们的数据。这恰恰说明猴并不能很好地表达人类语言

 

看似客观中立的数据,从不同的角度阐释,也能得出相反的结论。两方你来我往,各执立场,终究也没能争出一个所以然来。猿和猴子也至今没有说过一句话。这到底是由于大脑不够发达,还是由于声道条件有限……如同生物学领域的很多问题一样,依然是一个需要争论很久的话题。也许终有一天,随着技术的发展和思路的拓宽,我们会得到一个确切的答案——只是希望,那时候的我们并不是站在破败的加利福利亚街,“猴子们”的长矛与枪口之下。


排版:晓岚

滑动阅读全部参考文献:


[1] Lieberman, Philip, Dennis H. Klatt, and William H. Wilson. "Vocal tract limitations on the vowel repertoires of rhesus monkey and other nonhuman primates." Science 164.3884 (1969): 1185-1187.

 

[2] Lieberman, Philip, Edmund S. Crelin, and Dennis H. Klatt. "Phonetic ability and related anatomy of the newborn and adult human, Neanderthal man, and the chimpanzee." American Anthropologist 74.3 (1972): 287-307.

 

[3] Darwin, Charles. The descent of man and selection in relation to sex. Vol. 1. Murray, 1888.

 

[4] Fitch, W. Tecumseh, et al. "Monkey vocal tracts are speech-ready." Science advances 2.12 (2016): e1600723.

 

[5] Fitch, W. Tecumseh, et al. "Response to Lieberman on “Monkey vocal tracts are speech-ready”." Science Advances 3.7 (2017): e1701859.

 

[6] Lieberman, Philip. "Comment on “Monkey vocal tracts are speech-ready”." Science Advances 3.7 (2017): e1700442.

 

[7] Peterson, Gordon E., and Harold L. Barney. "Control methods used in a study of the vowels." The Journal of the acoustical society of America 24.2 (1952): 175-184.

 

[8] https://zh.wikipedia.org/wiki/%E5%85%B1%E6%8C%AF%E5%B3%B0



本文由微信公众号“果壳科学人(ID:scientific_guokr)”授权转载


编辑:山寺小沙弥


近期热门文章Top10

↓ 点击标题即可查看 ↓

1. 吃了一暑假的西瓜,我终于发明了能避开所有瓜籽的科学吃瓜法!

2. 想找女朋友吗?别急,看了这篇文章你就不想了

3. 大桥耗资百万,通车仅四个月竟被大风吹断,却成为建造史上的里程碑

4. 在七夕前夕,我终于用数学方法找到了脱单的窍门!

5. 他是最接近终极理论的人,被称为当今爱因斯坦

6. 他所创学派9夺诺奖,辩倒物理群雄无数,连爱因斯坦都未曾赢过

7. 为了读硕读博,你放弃过喜欢的人吗?

8. 她如何用一个申不到经费、被称作学校之耻的项目,革新了整个研究领域、掀起了如今的AI浪潮?

9. 让你失望了,地震云并不存在

10. 下雪后为什么感觉很安静?

点此查看以往全部热门文章


登录查看更多
0

相关内容

【ICML2020】持续图神经网络,Continuous Graph Neural Networks
专知会员服务
146+阅读 · 2020年6月28日
基于深度神经网络的少样本学习综述
专知会员服务
167+阅读 · 2020年4月22日
【ACL2020-Allen AI】预训练语言模型中的无监督域聚类
专知会员服务
23+阅读 · 2020年4月7日
麻省理工学院MIT-ICLR2020《神经网络能推断出什么?》
专知会员服务
50+阅读 · 2020年2月19日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
物理学家终于找到了一种拯救薛定谔猫的方法
中科院物理所
8+阅读 · 2019年6月10日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
三安光电到底发生了什么?
商业人物
7+阅读 · 2019年1月28日
【财富空间】一个人真正的资本是什么
产业智能官
6+阅读 · 2018年3月16日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
娈童者:所幸 生在这里
博望志
11+阅读 · 2017年5月17日
Arxiv
14+阅读 · 2020年1月27日
Graph Analysis and Graph Pooling in the Spatial Domain
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
6+阅读 · 2019年8月22日
Arxiv
8+阅读 · 2019年3月21日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
4+阅读 · 2018年10月31日
VIP会员
相关资讯
物理学家终于找到了一种拯救薛定谔猫的方法
中科院物理所
8+阅读 · 2019年6月10日
王维嘉:暗知识——机器认知的颠覆
亚布力中国企业家论坛
5+阅读 · 2019年3月12日
三安光电到底发生了什么?
商业人物
7+阅读 · 2019年1月28日
【财富空间】一个人真正的资本是什么
产业智能官
6+阅读 · 2018年3月16日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
娈童者:所幸 生在这里
博望志
11+阅读 · 2017年5月17日
相关论文
Arxiv
14+阅读 · 2020年1月27日
Graph Analysis and Graph Pooling in the Spatial Domain
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
6+阅读 · 2019年8月22日
Arxiv
8+阅读 · 2019年3月21日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
4+阅读 · 2018年10月31日
Top
微信扫码咨询专知VIP会员