长读长测序—揭示乳腺癌中的大规模基因组破坏

2018 年 7 月 22 日 生物探索

大约20％的乳腺癌是“HER2阳性”，它们会产生过量HER2蛋白，往往是最具攻击性的癌症之一。癌症做到早发现需要尽早准确的发现基因周围高度复杂的DNA变异。研究人员认为长读序列是捕获结构变异复杂性的宝贵工具，这对进一步研究和临床应用有着重要意义。

图片来源：Schatz Lab，CSHL / JHU

顶部矩形显示由HER2基因（也称为ERBB2）占据的染色体17的200万个碱基对区段。该基因的一小部分已经大量扩增，断裂并与8号染色体（下部矩形）融合。在该染色体上，基因的部分被复制多达1000次，其中各种片段在染色体内跳跃（绿色弧形）。

6月28日,发表在Genome Research杂志上题为"Complex rearrangements and oncogene amplifications revealed by long-read DNA and RNA sequencing of a breast cancer cell line"的研究中，科学家们证实了长读长测序的作用。

传统的短读长测序技术会忽略乳腺癌细胞系的部分变种，而用长读长测序技术读取癌细胞的基因组，可以读取更长的DNA片段。通讯作者Michael C. Schatz博士说，长读长测序(Long-read sequencing)使团队能够非常详细地重建 HER2基因在HER2阳性乳腺癌细胞中如何大量扩增的历史情况。

优势

拼写错误的基因、以及结构变异可包含大块染色体的DNA大规模重排，干扰已经进化以调节细胞生长的平衡机制。通常沉默的基因被大量激活并形成突变蛋白。这些和其他中断导致细胞无限制生长，是癌症最显著的标志。

冷泉港实验室（CSHL）的科学家在Genome Research发表了有关癌细胞基因组结构变异的详细图谱。该图揭示了大约20,000个结构变异。

测序专家Michael C. Schatz和W. Richard McCombie领导的团队使用了长读长测序技术读取癌细胞的基因组。与旧的短读技术相比，该技术可以读取更长的DNA片段。当使用团队最近发布的两个复杂软件包解释结果时，长读长测序在信息和上下文方面更丰富。例如，它可以通过看到更多的物理背景来更好地理解DNA字母的重复延伸。

该团队通过使用这种技术来读取源自SK-BR-3细胞系的细胞基因组，展示了长读长测序的强大功能。其中SK-BR-3是乳腺癌细胞的一个重要模型，具有HER2基因的变异（有时也称为ERBB2）。

发展

Maria Nattestad博士说，“我们在这个细胞系中发现的20,000个变种中大多数都被短读长测序所遗漏。”Maria Nattestad博士与同事一起完成了这项工作，并在HER2基因周围发现了一系列高度复杂的DNA变异。该团队将长读长测序的结果与另一种实验的结果相结合，读取由激活基因产生的信息或转录本。这个更全面的图片非常详细地描述了结构变异如何破坏癌细胞中的基因组并揭示癌细胞是如何快速进化的。

作者之一McCombie说，“使用最好的技术继续建立变异癌细胞类型的目录至关重要”。长读长测序是捕获结构变异复杂性的宝贵工具，随着测序成本的进一步下降，研究人员期望其能广泛应用于研究及临床实践。

责编：风铃

End

参考资料：1）Massive genome havoc in breast cancer is revealed

本文系生物探索原创，欢迎个人转发分享。其他任何媒体、网站如需转载，须在正文前注明来源生物探索。