Oncogene, Volume 43 Issue 41 (2024)

Bioinformatics advances in eccDNA identification and analysis

doi:10.1038/s41388-024-03138-6

eccDNA鉴定分析中的生物信息学进展

  染色体外环状DNA(eccDNA)是存在于真核生物中的一种特殊类型的环状DNA分子,它们独立于线性基因组DNA,脱离染色体基因组,参与生理或病理过程。其研究历程可追溯至1965年,当时Hotta等人受Stahl关于高等生物体环状染色体理论的启发,通过电子显微镜首次在哺乳动物细胞公猪精子DNA样本中揭示了eccDNA的存在;同年,通过染色与光学显微镜检查,人体肿瘤染色体中的极小型双染色体体(DM)也被确认。1979年,研究揭示了在不稳定的甲氨蝶呤耐药细胞中,扩增的二氢叶酸还原酶基因(DHFR)与DM之间的关联。1996年,二维凝胶电泳(2D)技术成功分离了基于不同物理特性的eccDNA与染色体DNA。2012年,电子显微镜再次发现了microDNA,并催生了Circle_finer工具的诞生。2014年的研究指出,表皮生长因子受体变体EGFRvIII相关的eccDNA缺失会促进耐药性的产生。2015年,全基因组eccDNA纯化方法(Circle-seq)的问世,为绘制酵母基因组中的eccDNA提供了可能。2017年,首次系统性研究揭示了17种不同人类肿瘤中eccDNA的普遍存在,表明其在肿瘤加速进化过程中的重要作用。此后,更多的eccDNA富集方法不断涌现。2018年,Møller等人发现eccDNA在健康人体组织中同样常见,并创新性地创建了CRISPR-C方法来生成不同大小的内源性eccDNA,同时揭示了eccDNA不均匀的遗传模式。2019年,研究揭示了eccDNA上扩增的致癌基因通过更易接近的染色质和邻近的功能增强子实现高效表达。2020年,更多关于eccDNA功能机制的发现涌现,如增强子劫持和eccDNA衍生的基因组重塑,并在母体血浆中检测到了eccDNA的存在。CIDER-seq,一种结合长读长测序的eccDNA富集方法,有效克服了传统NGS方法的局限性。2021年,研究揭示了eccDNA作为移动的转录增强子和先天性免疫刺激物的新角色,eccDNA集群能够促进致癌基因的过表达,并开发了基于TGS的单细胞全基因组测序方法——SMOOTH-seq。2022年,研究揭示了eccDNA中的环状突变现象,并将CRISPR-CATCH方法应用于eccDNA领域。2023年的研究则表明,eccDNA在肿瘤发生之前就已存在,并且开发了更多的单细胞eccDNA测序方法。

  众多综述文章已全面探讨了eccDNA的生物发生与功能,而本文则聚焦于与eccDNA领域紧密相关的生物信息学工具与数据库。eccDNA的发现历程、分类以及不同类型eccDNA的形成机制、特征和潜在功能已在其他文献中得到了广泛讨论。鉴于eccDNA最初主要在肿瘤组织中被发现,因此,针对其在肿瘤中作用的研究更为集中。一些综述专门阐述了eccDNA在基因扩增、药物耐受性和肿瘤异质性中的生物学功能,而另一些则重点讨论了eccDNA的临床应用,概述了eccDNA作为生物标志物的最新进展,并探讨了其在指导疾病治疗方法中的潜力。近期的综述还涵盖了eccDNA发现与分析的实验方法。对eccDNA作为调控元件,通过其独特结构和染色质相互作用调节目标基因的理解进展也被深入总结。此外,将eccDNA与单细胞分析相结合,探索单个细胞水平的eccDNA,为阐明eccDNA介导的肿瘤异质性提供了新视角。

  目前,普遍认为eccDNA的形成与DNA损伤修复机制密切相关。大多数由染色体断裂产生的DNA片段会通过DNA修复系统得到修复或清除,但部分残留或切割的DNA片段可能会连接并重新组装成环状DNA结构,这些结构能够在细胞分裂过程中复制并随机分配。染色体断裂可能是灾难性的全染色体事件,即染色体碎裂模型,也可能是局部的双链DNA断裂(double-strand DNA breaks, DSB)。断裂-融合-桥接(breakage-fusion-bridge, BFB)循环是另一种基因组重排过程的模型,其起始于染色体的DSB,如端粒丢失。除染色体断裂外,由结构变异(structural variations, SVs)修复产生的DNA片段,如易位,也可形成eccDNA,这被称为易位-缺失-扩增模型。内含子模型则表明,具有复制起点的DNA片段由于复制叉停滞或基因组重排而脱落,可能环化成自主复制的内含子,随后聚合成eccDNA。此外,这些eccDNA分子还可能相互融合形成复杂的eccDNA,或重新整合到线性染色体基因组中。

标签: Oncogene, eccDNA, 染色体外环状DNA