eccDNA鉴定分析中的生物信息学进展
在最初的研究中,eccDNA根据其结构特征被称为DM(双微体)。随着对不同大小eccDNA的分离与鉴定,这一术语逐渐演变。1990年,eccDNA被正式定义为一个广泛的术语,用以描述所有非线粒体和非质粒的染色体外环状DNA。然而,基于其大小和序列特征,在肿瘤中发现的eccDNA仍可被细分为几类:微小DNA(microDNA)、小多分散DNA(small polydispersed DNA, spcDNA)、端粒环(telomeric circles, t-circles)以及环状DNA(ecDNA)。此外,大小介于典型microDNA和ecDNA之间的eccDNA通常统称为环状DNA或狭义上的eccDNA。在正常细胞中,无基因的小型eccDNA更为常见,而在肿瘤细胞中,eccDNA则主要是含有完整原癌基因的ecDNA。
尽管大多数eccDNA处于沉默状态且不具功能,但在特定情境下,它们可能在肿瘤的发生与发展中发挥关键作用。eccDNA的多拷贝和松散可接近的结构导致其上扩增的原癌基因过表达。eccDNA的环状结构改变了其拓扑学特征,研究表明它能够将局部的上游增强子或远距离增强子与原癌基因拉近,从而促进这些增强子和原癌基因在环状结构内的相互作用,进而增强基因的表达。同时,携带增强子的eccDNA可能作为可移动的转录激活因子,与染色体DNA形成eccDNA集群,以调控原癌基因的表达。eccDNA上的聚集突变可以加速肿瘤进化,并导致药物耐受性。由于缺少着丝粒,eccDNA的不一致遗传也可能导致肿瘤细胞的异质性,进而产生治疗耐药性。此外,越来越多的证据表明,eccDNA还参与了多种生理事件,包括eccDNA衍生的基因组重塑、细胞间通讯、先天免疫和衰老。
高通量测序技术的飞速发展以及相关生物信息学工具和数据库的不断涌现,为深入理解eccDNA提供了前所未有的机遇。全基因组测序(WGS)和eccDNA富集方法(如Circle-seq)已成为分析eccDNA的重要手段。早在2012年,首个用于从下一代测序(NGS)数据中鉴定eccDNA的生物信息学工具便已问世。然而,直至2017年,才有研究利用NGS技术对多个肿瘤样本中的eccDNA进行了大规模分析,从而确认了eccDNA在肿瘤细胞中的广泛存在。这一研究标志着eccDNA研究真正迈入了高通量测序时代,后续的研究重点则聚焦于其生成机制、特征和功能上。
在本综述中,作者收集并分析了约20种适用于eccDNA研究的生物信息学工具,这些工具涵盖了各种实验技术,包括独立程序和数据库。作者对这些工具进行了全面总结,并深入探讨了eccDNA生物信息分析中的当前挑战与未来发展趋势。
用于eccDNA研究的生物信息工具
早期对eccDNA的鉴定主要依赖于光学成像技术,如电子显微镜与光学显微镜,通过直接观察其独特的环形结构进行识别。然而,随着分子生物学实验技术与高通量测序技术的飞速发展,下一代测序(NGS)技术得以解析eccDNA的详细序列信息,为深入探究eccDNA的特性、起源及功能提供了前所未有的机遇。自2012年起,针对NGS数据的一系列生物信息学工具应运而生,这些工具虽功能各异,但可大致划分为两大类别:eccDNA识别工具与eccDNA注释数据库。前者专注于eccDNA的鉴定,而后者则整合了来自多项研究的eccDNA数据,并提供了详尽的注释信息。
eccDNA识别工具