长得像的人DNA也相似,这事儿有科学实锤了

2022 年 9 月 5 日 量子位
詹士 发自 凹非寺
量子位 | 公众号 QbitAI

「诶,你跟我前女友长得挺像,我差点认错」

男生搭讪女孩,总有人用这种烂俗套近乎招数,整得大家仿佛很熟,仿佛很有缘分(手动狗头)。

当然,不止现实搭讪,长得像「异父异母亲兄弟姐妹」这件事,从来是网上玩梗打趣的热门话题…

比如,林东临和郭俊杰…

不光你我关心,这事儿被科学家拿来当成了研究问题,还有了结论:

相似长相的人确实「有缘」,他们可能有相似DNA。

最新一份发表在Cell子刊的文章显示,面部相似的人共享着相同基因序列。

这结论他们怎么得出的?靠谱么?

一起来看看。

请机器来找「异父异母的亲兄弟」

首先要找一堆长相几乎一模一样的人作样本。面对全球70亿茫茫人海,怎么找是个问题。

科学家找到了加拿大艺术家弗朗索瓦布鲁内尔 (François Brunelle)。从1999年,这位艺术家就在全球收集相似人相。

靠着「找对门路」,科学家获取了32对长相酷似的样本,并请参与者提供了详细的生物特征、所在地及生活方式问卷。

为保证脸部比对更客观,科学家找来三种算法/模型,共同「拆解」脸部细节,判断相似度。

其中包括了——

(1)自定义深度卷积神经网络Custom-Net,一种来自AI公司Herta,主用于监控领域的CNN模型;

(2)应用在Matlab上,常用于面部分类任务的MatConvNet

(3)来自微软Azure的Microsoft Oxford Project人脸API,常用于面部分析;

这些模型内置数百万参数,且历经上千主题下的数百万张面部图像训(折)练(磨),能识别姿势、发型、表情、年龄、配饰等诸多特征,对相似图像,模型将给出从0到1的一个相似度区间。

如果机器们三方「会审」一致判断极为相似,那科学家就会将样本作为重点研究对象。最终在32对样本中,有16对被三方认可。

之后是DNA比对环节。

科学家利用一种名为单核苷酸多态性 (SNP) 的基因特征,比对各组长相高度相似人的唾液内DNA样本。

此后,再通过无监督聚类热图检测,让机器判断每对DNA是否属于一个类型(即相似)。

结论有点因吹斯汀

结果显示,在16对「被机器全部认可」样本DNA中,科学家发现,有9对被聚成一类,他们在3700个基因中,共享了超过19200个SNP。同样,在K-means算法中,最终结论也类似。

此外,科学家还研究了相似配对的生物特征及生活方式。他们在体重、身高、是否吸烟、教育水平等方面也在配对组中相互有关联,这说明,共享的遗传变异不仅影响长相,也造成相似的行为和习惯。

研究者形容该结果十分「striking」。研究者还排除了近亲关系的可能,并发现,这些样本比长相不同的双胞胎,基因相似度更高。

更有意思的是,剩下16组未通过三方机器视觉特征认可的样本中,也只有一对样本DNA被聚类在一个集合。

在人种和地域方面,科学家还进行祖先溯源,他们观察到,几乎所有相似配对样本的祖上生活地区都很靠近。


但需要指出,本文主题在其他多组学研究中,却有着不同结论。

比如DNA甲基化模式下,16对高度相似样本只有一对匹配;

再比如从微生物角度看,16对相似样本中,口腔菌群相似的仅一对,且这对样本通过SNP也没被聚类到一起。该领域有研究认为,口腔微生物相似度与皮下脂肪有关,可能导致相似长相(如:脸上肉多)特征的人,有相似的口腔微生物特征。

团队介绍

本文一作Ricky S. Joshi,计算生物学家,来自西班牙巴萨罗那Josep Carreras 白血病研究所 (IJC),研究方向主要为遗传学和表现遗传学,其个人页面显示,Ricky致力于发现人类基因组中的病理性变异。

二作Maria Rigau ,同样Base在西班牙,是巴塞罗那超级计算中心 (BSC)的博士,专业为生命科学,主页头像显示,这是一位蛮喜欢狗狗的女研究者。

One More Thing

有网友指出,马斯克长相有点像爱迪生,还Po了下面这张图——

不知你怎么看?(手动狗头)

参考链接:
https://www.cell.com/cell-reports/fulltext/S2211-1247(22)01075-0
https://neurosciencenews.com/genetics-look-alikes-21283/
https://hertasecurity.com/
https://bigthink.com/health/look-alike-genetics-behavior/


「人工智能」、「智能汽车」微信社群邀你加入!

欢迎关注人工智能、智能汽车的小伙伴们加入我们,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位哦 ~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~




登录查看更多
0

相关内容

Bioinformatics | 注释scRNA-seq数据时自动识别新细胞
专知会员服务
7+阅读 · 2022年9月25日
「小样本深度学习图像识别」最新2022综述
专知会员服务
101+阅读 · 2022年1月15日
群体行为识别深度学习方法研究综述
专知会员服务
31+阅读 · 2021年11月29日
ICLR 2021 评审出炉!来看看得分最高的50篇论文是什么!
专知会员服务
40+阅读 · 2020年11月13日
3D模型“换皮肤”有多简单?也就一句话的事
量子位
0+阅读 · 2021年12月29日
论文图片误用?AI:这条路已被我堵死了
量子位
0+阅读 · 2021年12月22日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
14+阅读 · 2020年9月1日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
17+阅读 · 2019年3月28日
Arxiv
12+阅读 · 2019年2月26日
Arxiv
10+阅读 · 2017年7月4日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
相关论文
Arxiv
14+阅读 · 2020年9月1日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
17+阅读 · 2019年3月28日
Arxiv
12+阅读 · 2019年2月26日
Arxiv
10+阅读 · 2017年7月4日
Top
微信扫码咨询专知VIP会员