此外,eccDNA所携带的信息可能与线性基因组有所不同,包括连接的断点和超突变等,这些因素都会导致eccDNA序列的变化,进而影响与eccDNA相关的基因和调控元件。因此,准确完整的eccDNA序列对于揭示其功能至关重要。然而,由于NGS方法的读长有限,在重构eccDNA全长序列时容易引入组装错误。相比之下,TGS在重构eccDNA全长序列时具有多项优势,包括超长读长、高度重复基因组区域的可映射性以及测序设备(如ONT)的灵活性。然而,TGS的主要缺点是总体错误率较高且成本较高。结合NGS和TGS的方法将能够更有效地促进eccDNA准确全长序列的重构,从而为eccDNA研究提供新的见解。

  circRNA与eccDNA共享相似的闭环结构。然而,与eccDNA的研究方法相比,circRNA的研究在生物信息学领域更为多样化和成熟。circRNA的识别也基于跨越连接断点的reads的原理,但采用了多种策略:有些策略与eccDNA的方法相似,检测非线性方式映射的嵌合reads;有些则基于已知注释构建伪参考;还有一些新管道结合了多种工具,以提供更准确的circRNA检测。在定量方法上,circRNA的研究相较于eccDNA拷贝数的确定更为先进。尽管eccDNA和circRNA在基因组来源和序列特征上存在差异,但circRNA的研究在实验和生物信息学方法上为eccDNA提供了有益的参考。

  综上所述,作为一个新兴的研究领域,近年来对eccDNA的理解已取得了显著进展。尽管已有多个eccDNA生物信息学工具和数据库可供使用,但仍缺乏合适的方法来充分利用大量的实验测序数据。eccDNA在疾病中,尤其是在肿瘤中的功能作用显著,其特性表明它在肿瘤诊断和治疗中具有潜在的应用价值。然而,仍有许多谜团有待揭示,期待更多全面的生物信息学方法为eccDNA领域带来新的视角和突破。

标签: Oncogene, eccDNA, 染色体外环状DNA