【文末有福利】吸烟致癌,是基因的错吗?

2019 年 9 月 20 日 算法与数学之美
20 世纪50 年代和60 年代那场关于吸烟是否致癌的辩论在科学领域乃至政治领域引起广泛纷争。那个时代对吸烟致癌论持怀疑态度的学者,包括费舍尔和雅各布·耶鲁沙米,曾提出吸烟和癌症之间的明显联系可能是由一个混杂因子带来的统计学产物,并没有实际含义。耶鲁沙米认为,这一混杂因子是人格类型,而费舍尔认为混杂因子是吸烟基因,吸烟基因的携带者可能一方面更偏好吸烟,更容易染上烟瘾,一方面患肺癌的风险也更高。


具有讽刺意味的是,2008年,基因组解析方面的研究者发现,费舍尔的主张竟然是正确的: 的确存在这样一个“吸烟基因”,且其作用机制与费舍尔的设想完全一致。 这一发现的提出建立在一项新的基因组分析技术之上,这项新技术被称为“全基因组关联研究”(genome-wide association study,简称为GWAS)。 这是一种典型的“大数据”方法,其让研究人员得以对整个基因组进行统计梳理,寻找在某些疾病(如糖尿病、精神分裂症或肺癌等)的患者中更常出现的基因。


需要注意的是,在全基因组关联研究这个概念名称中,“关联”这个词很重要。 其说明了这种方法不能证明因果关系,只是在给定的样本中确定与某种疾病相关的基因。 这种方法是数据驱动的,不是假设驱动的,而这一特性给因果推断带来了麻烦。


尽管此前基于假设的基因研究未能找到任何明确的证据,证明存在与吸烟或肺癌相关的基因,但在2008年,事情突然发生了变化。 那一年,研究人员发现了一个位于第十五染色体区域的基因a,该基因编码了肺细胞中尼古丁的受体。 它有一个正式的名字,rs16969968,不过即使是对基因组学的专家来说,这个名字也太过冗长拗口了,因此他们开始称它为“大个儿”或“大先生”,因为它与肺癌有着极其紧密的联系。 “在吸烟影响这个研究领域,提到大先生,人们就知道你在说什么。 ”圣路易斯华盛顿大学吸烟影响领域的专家劳拉·毕鲁特说道。 在本书中,就称它为“吸烟基因”。


吸烟基因与肺癌有关。 它有两个变异体,一个常见,一个不太常见。 继承了两份不常见变异体的人(大约占总人口的1/9)有大约77% 的风险患肺癌。 吸烟基因似乎也与吸烟行为有关。 携带此高风险变异体基因的人似乎需要更多的尼古丁才能满足,对于他们来说,戒烟相当困难。 然而,我们也有一些好消息: 这些人对尼古丁替代疗法的反应比不携带此吸烟基因的人要好。


引发肺癌的真正关键的因素是吸烟,而吸烟基因的发现不应该改变这一强有力的观点。 我们已经知道吸烟行为会导致我们患肺癌的风险增加10 倍以上。 而相比之下,即使我们携带的吸烟基因的数量增加了1 倍,它也不至于让你患肺癌的风险翻倍。 是否携带吸烟基因确实是一件非常严肃的事情,但它带来的风险与经常(无缘无故地)吸烟带给你的危险相比可以说是微不足道的。


和以往一样,绘制一张因果图总是有助于我们阐明问题。 如图1 所示,费舍尔认为吸烟基因是吸烟行为和肺癌的混杂因子(就当时而言只是一个纯粹的假设)。 但作为一个混杂因子,它远远不足以解释吸烟对肺癌患病风险的压倒性的影响。 这本质上就是杰尔姆·康菲尔德在他1959 年的论文中提出的不等式,他在当时借此推翻了基因假说,结束了关于吸烟是否致癌的争论。


图1 吸烟基因例子的因果图


我们可以很容易地将这张因果图改写为如图2 所示的因果图。 在此例中,我们看到“吸烟行为”是“吸烟基因”和“肺癌”之间的中介物。 从这个角度看,对这一因果图的略微修改彻底重写了这场科学辩论。 我们不再问吸烟行为是否致癌(这是一个我们已经知道答案的问题),而是问这个吸烟基因是如何起作用的。 它是否会导致人们吸更多的烟,且吸入更多的烟雾? 或者,它是否会让肺细胞变得更容易遭到癌症细胞的侵蚀,从而导致人们患上癌症? 间接效应和直接效应哪个更强?


问题的答案对治疗产生的影响很重要。 一方面,如果效应是直接的,那么携带高风险变异体基因的人或许就应该接受额外的肺癌筛查。 另一方面,如果效应是间接的,那么吸烟行为就变得至关重要。 我们应该劝告这些病人,让他们知道吸烟带来的风险以及不吸烟的重要性。 如果他们已经养成了吸烟的习惯,我们可能就需要实施一种更积极的干预,比如尼古丁替代疗法。


哈佛大学的流行病学家泰勒·范德维尔在《自然》中读到了第一篇关于吸烟基因的报告,并联系了由文章作者大卫·克里斯蒂安领导的哈佛大学的一个研究小组。 自1992年以来,克里斯蒂安一直要求他的肺癌患者以及他们的朋友和家人填写问卷,并提供DNA样本以帮助研究者展开研究工作。 在2000年中期,他收集了1 800例肺癌患者的数据,还有作为对照的1 400名未患肺癌者的数据。 当范德维尔打来电话时,那些DNA样本仍然在冷冻库里冷冻着。


图2 对图1的微调


起初,范德维尔的分析结果着实令人惊讶。 他发现,间接效应所增加的肺癌患病风险仅为1%至3%。 携带高风险变异体基因的人平均每天仅比不携带此基因的吸烟者多抽一根烟,不足以构成临床上的相关。 然而,他们的身体对吸烟的反应有所不同。 吸烟基因对肺癌的影响很大,也很重要,但只限于那些吸烟的人。


这就为我们报告结果提出了一个有趣的难题。 在该例中,一方面, CDE(0)本质上是0: 如果你不吸烟,这种吸烟基因就不会伤害你。 另一方面,如果我们把中介物的值设置为一天1 包烟或一天2 包烟,可将其表示为CDE(1)或 CDE(2),那么基因的作用就会变得很大。 自然直接效应就是这些受控效应的平均值。 因此,自然直接效应NDE 是正的,而范德维尔也是这样报告他的结果的。


这个例子是一个关于相互作用的典型案例。 最后,范德维尔的分析证明了有关吸烟基因的3 个重要假设: 第一,它并不会导致吸烟量的显著增加。 第二,不吸烟,吸烟基因就不会导致肺癌。 第三,对于那些有吸烟习惯的人来说,吸烟基因会大大增加其患肺癌的风险。 基因和主体行为之间的相互作用在这个例子中显得尤其重要。


与任何新得出的研究结论一样,我们当然还需要做进一步的研究。 针对范德维尔和克里斯蒂安的分析,毕鲁特指出了一个问题: 他们对吸烟行为只做了一种测量——每天吸烟的数量。 但吸烟基因也可能导致人们吸入的烟雾更多,从而每吸一口都摄入了更多的尼古丁。 而哈佛大学的这项研究缺乏数据用以检验这一理论。


尽管仍然存在一些不确定因素,但关于吸烟基因的研究已经足以为个性化医疗的未来指出方向。 很显然,在该例中,真正重要的是基因和行为是如何相互作用的。 我们仍然不确定基因是否会改变行为(就像毕鲁特提到的那样),或者基因仅仅与某种注定会出现的行为具有某种相互作用(就像范德维尔认为的那样)。 但不管怎样,我们都能通过其所携带基因的特性告知人们所面临的患病风险信息。 在未来,能够检测基因与行为、基因与环境间的相互作用的因果模型,必将成为流行病学家的一个重要工具。


(本文整合自《为什么: 关于因果关系的新科学》第九章 中介: 寻找隐藏的作用机制)


《为什么: 关于因果关系的新科学》
作者: 朱迪亚·珀尔,达纳·麦肯齐
出版社: 中信出版社

***粉丝福利时间***

评论区留言,点赞数前四可获得此书!!!

48个小时计!

注:若是在活动截止日期后24小时内(即9月21日24:00)无法取得用户回复或联系,将按照留言点赞排名顺延。


登录查看更多
0

相关内容

最新《自动微分手册》77页pdf
专知会员服务
102+阅读 · 2020年6月6日
【ICML2020-哈佛】深度语言表示中可分流形
专知会员服务
13+阅读 · 2020年6月2日
专知会员服务
28+阅读 · 2020年3月6日
【BAAI|2019】用深度学习模拟原子间势,王涵  (附pdf)
专知会员服务
18+阅读 · 2019年11月21日
一文读懂机器学习中的贝叶斯统计学
数据分析
26+阅读 · 2019年5月8日
外泌体行业规模2030年预计将达22.8亿美元
外泌体之家
18+阅读 · 2019年3月26日
丘成桐:攻克物理难题的数学大师
科技导报
5+阅读 · 2018年7月23日
干货来袭:漫谈概率统计方法与因果关系
数据猿
5+阅读 · 2018年2月23日
Arxiv
24+阅读 · 2019年11月24日
Arxiv
3+阅读 · 2018年10月5日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
5+阅读 · 2017年4月12日
VIP会员
相关VIP内容
相关论文
Arxiv
24+阅读 · 2019年11月24日
Arxiv
3+阅读 · 2018年10月5日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
5+阅读 · 2017年4月12日
Top
微信扫码咨询专知VIP会员