| 作者:余尚倍 曾钰桐 (华南农业大学)
先简单介绍一下单细胞ATAC-seq。ATAC-seq的全称是Assay for Transposase-Accessible Chromatin with high throughputsequencing。在基因组上,有很多开放的染色质区域,这些区域是转录因子和转录元件的重要结合位点。在此之前,其实已经有多种手段可以用来研究转录调控区域。比如DNAse-seq和FAIRE-seq,但是相比于这两个技术,ATAC-seq具有样本数目少(约500个细胞就足够)、时间短等特点,在转录组学和表观遗传学等方面的作用令人值得期待,因此在近期具有相当高的研究热度。
在2019年《Nucleic Acids Research》的第47期No.2中, 来自英国曼彻斯特大学的研究人员发表了单细胞ATAC-seq分析工具Scasat在细胞分类中的应用。
目前,单细胞ATAC-seq分析工具Scasat在细胞分类中的表现出积极的作用。Scasat是一个用简单的步骤处理scATAC-seq数据的完整管道。它将数据视为二进制,并应用特别适用于二进制数据的统计方法。该管道是在Jupyter笔记本环境中开发的,该环境包含可执行代码以及必要的描述和结果。
一.完整的Scasat工作流程
下图描述了完整的Scasat工作流程。首先是修整低质量碱基的预处理步骤,将读数与相应的基因组对齐并调用峰。然后通过合并每个单个单元的所有映射的BAM文件并在该合并文件中调用峰值来生成峰值可访问性矩阵。下游分析由对单细胞ATAC-seq数据进行统计分析的必要步骤组成。在Scasat中,数据被转换为二进制数据集。将维度减少方法应用于该二值化数据后,对该减小的维度进行其他统计分析以推断生物信息。
二.差分可访问性问题
研究团队还从完全不同的角度解决了差分可访问性问题。其中使用熵和信息增益来计算两组小区之间的差异可访问峰值。研究人员将Scasat应用于细胞混合物,将这些细胞去卷积成不同的组。分析的初步结果表明,批次效应混淆了生物信号,这阻碍了细胞分类成不同细胞类型。因此,进一步开发Scasat以克服这种批次效应问题。最终结果显示,基于可接近的染色质区域的无监督聚类细胞可以将细胞分组成它们相应的细胞类型。这表明监管要素可以非常精确地定义细胞身份。可以应用类似的方法将恶性细胞与癌组织中的正常细胞分开,然后详细研究恶性细胞。
三.Scasat的优异功能
该工具还具有新颖的分析功能,可将开放的染色质信息作为二进制数据进行处理,并在保持数据的二进制特性的同时校正批次效应。这使得Scasat在分析单细胞ATAC-seq数据方面优于其他工具。
Scasat还成功应用于公开可用的数据集,显示其用于处理和分析使用不同协议和平台生成的单细胞ATAC-seq数据集的总体效用。该工具的成功实施有助于进一步了解单细胞水平的表观遗传机制,并为更容易和更好地分析单细胞ATAC-seq数据提供了机会。
这些数据基于实际实验结果。Nucleic Acids Research评论认为,在未来,这种分析方法将更广泛的应用于细胞分类。
参考资料
[1] Classifying cells with Scasat, a single-cell ATAC-seq analysis tool
[2] Profiling of Accessible Chromatin Regions Across Multiple Plant Species and Cell Types Reveals Common Gene Regulatory Principles and New Control Modules
中国生物技术网诚邀生物领域科学家在我们的平台上,发表和介绍国内外原创的科研成果。
注:国内为原创研究成果或评论、综述,国际为在线发表一个月内的最新成果或综述,字数500字以上,并请提供至少一张图片。投稿者,请将文章发送至weixin@im.ac.cn。
本公众号由中国科学院微生物研究所信息中心承办
微信公众号:中国生物技术网 回复关键词“热点”可阅读热点专题文章,包括“施一公”、“肠道菌群”、“肿瘤”、“免疫”和“健康”