目前检测eccDNA的实验方法主要有三类:全基因组测序(WGS)实验、eccDNA富集实验以及包括ATAC-seq在内的其他实验技术。
  传统的WGS方法能够同时捕获线性基因组与eccDNA序列,但由于eccDNA相较于线性基因组的丰度往往极低,仅有部分高拷贝数的eccDNA能在WGS数据中得以显现。为更全面地描绘eccDNA的图谱,研究者们开发了多种eccDNA富集技术,结合高通量测序以识别低背景噪声下的eccDNA。其中,Circulome-seq、Mobilome-seq、Circle-seq及CIDER-seq等方法尤为突出。Circle-seq通过内切酶与外切酶消化线性DNA,随后利用高效的ϕ29 DNA聚合酶对eccDNA进行滚环扩增(rolling circle amplification, RCA);Mobilome-seq则仅依赖外切酶消化线性DNA,以最大化保留eccDNA分子;CIDER-seq采用质粒提取试剂盒提取eccDNA,同时保留线性DNA;而Circulome-seq则利用Tn5转座酶系统进行片段化与标记,有效避免了RCA过程中可能引入的伪影。此外,ATAC-seq数据集同样可用于eccDNA的识别。ChIP-seq、ChIA-PET及Hi-C等技术则进一步揭示了eccDNA的染色质可及性与核小体压缩状态,为eccDNA的精细表征提供了有力支持。近期,单细胞全基因组测序方法SMOOTH-seq及单细胞eccDNA富集技术,如scEC&T-seq、scGTP-seq和scCircle-seq,已被成功开发,实现了在单细胞水平上对eccDNA的检测与特征描述。
  eccDNA的识别标准不仅涉及覆盖eccDNA连接断点的测序读段,还包括因eccDNA拷贝数变异而导致的测序深度分布变化,这是减少假阳性结果的关键过滤条件。因此,将测序读段与参考基因组进行比对成为几乎所有工具的必要步骤,其中,bwa与minimap2分别是NGS与第三代测序(TGS)数据的优选比对工具。
  值得注意的是,除了基于机器学习(machine learning, ML)模型预测eccDNA存在的Deepcircle外,其余所有工具均依赖于eccDNA的连接断点(joint breakpoints, BP)证据来实现eccDNA的准确识别。

基于断点的eccDNA识别工具

  来自染色体断裂的DNA片段通过连接形成环状结构,进而产生连接点,这些连接点即为eccDNA的断点所在。跨越这些断点的扩增DNA片段,作为识别eccDNA最直接且有力的证据,其在NGS数据中主要表现为两种读段类型:一是分裂读段(split reads, 或称软剪读段, soft-clipped reads),这类读段的所有片段能够比对到参考基因组的不同位置,从而精确揭示eccDNA断点的基因组坐标;二是不一致读段对(discordant read pairs),它们的方向与参考基因组中的预期方向相悖,暗示了eccDNA的存在,但遗憾的是,它们无法直接提供断点的具体位置信息。目前,绝大多数生物信息学方法都是基于这两类读段特征来识别eccDNA。

  Circle_finder作为首个针对NGS数据设计的eccDNA识别工具,它巧妙地结合了不一致读段对和分裂读段的信息来精准捕捉eccDNA的信号。然而,仅凭读段信息来确定eccDNA的存在,往往会导致较高的假阳性率。为了降低这一风险,后续的研究开始融入更多的eccDNA特征以及测序读段的辅助证据:eccDNA的存在会显著提升其所在区域的拷贝数,特别是在线性DNA被移除或消化的实验条件下,这种拷贝数的增加尤为明显。Circle-Map通过细致分析候选eccDNA断点周围的测序深度变化以及区域内的覆盖率,有效地过滤掉了大量假阳性候选。而ECCsplorer则采取了一种更为全面的策略,它分别识别出具有不一致读段对、分裂读段以及局部高覆盖率的基因组区域,随后将这些候选区域进行匹配或重叠比较,最终输出可靠的eccDNA结果。此外,ECCsplorer还支持对照样本数据的分析,从而能够检测到特定富集的eccDNA。

  近年来,随着计算方法的不断进步,研究者们开始揭示复杂eccDNA的精细结构,这些结构往往由来自一个或多个染色体的多个不连续DNA片段组成。DMFinder便是一个杰出的代表,它整合了拷贝数变异算法RDXplorer以及两种结构变异预测算法BreakDancer和Delly,通过将这些算法的结果融入基于图的算法中,DMFinder能够从NGS数据中准确预测出复杂的eccDNA结构。类似地,AmpliconArchitect (AA)也是基于拷贝数变异(CNV)和结构变异(SV)的分析结果,它利用不一致读段对和分裂读段构建出断点图,进而将图分解为简单循环,并可视化地呈现出重构的eccDNA结构。

标签: Oncogene, eccDNA, 染色体外环状DNA