人类基因组测序数据揭示,超过50%的DNA序列由转座元件(Transposableelements,TEs,又称转座子)所组成,其中反转录转座子(以下简称为反转座子)占绝对比例。顾名思义,反转座子通过转录产生中间体RNA,进而被反转录形成新的DNA拷贝,整合进宿主基因组中(即"复制-粘贴"机制)。人类基因组主要包含长末端重复序列(longterminalrepeat,LTR)、非长末端重复序列(non-longterminalrepeat,non-LTR)和SINE-VNTR-Alu(SVA)序列等三种类型的反转座子。其中,LTR反转座子或内源性逆转录病毒(endogenousretrovirus,ERV)起源于外源逆转录病毒的侵染。在数千万年的进化过程中,ERV逐渐被固定下来,成为宿主基因组的一部分(大约占人类基因组的8%)。另一方面,non-LTR序列,包括LINE和SINE,大约占人类基因组的30%。LINE-1(L1)是一类自主性反转座子,能够表达一整套负责转座的蛋白机器。相比之下,作为类人猿所特有的一种非自主性反转座子,SVA可以利用L1元件产生的蛋白机器来实现转座。绝大多数反转座子由于序列突变或受表观调控而处于转录沉默状态,因此长期以来被称认为是“无用DNA”或“化石DNA”。近年来,得益于多组学测序及基因组编辑技术的发展,越来越多的证据表明,这些所谓的“无用DNA”可能对人类发育和健康至关重要。
逆转座子调控人类早期胚胎发育
在进化过程中,ERV不同程度地保留了其祖先外源病毒的原始特征。其中,某些对宿主发育及健康有利的ERV元件被驯化或共选择下来,成为宿主基因组的必要部分。例如,由HERV包被膜基因(如HERVW-1、HERV-FRD1)所编码的合胞素(如Syncytin-1,-2)在人类胎盘合胞体滋养层形成过程中起着重要作用。此外,作为进化上最为年轻的ERV,HERVK(HML-2)可通过表达附属蛋白Rec来促进人类植入前胚胎的抗病毒免疫反应。此外,LTR为人类早期胚胎发育过程中的基因表达提供了丰富的顺式调控元件,如增强子、启动子及polyA位点等。多种灵长类/类人猿特异性反转座子在人类胚胎植入前发育过程中被阶段特异性地重新激活,表明这些反转座子参与构建人类早期胚胎发育的基因调控网络。此外,LTR5_Hs元件(即HERVK的末端调控序列)还被发现可作为增强子促进人类原始生殖细胞的特化,表明其在人类生殖细胞发育中的发挥重要作用。
特别是,利用微量细胞ChIP-seq或cutrun技术,研究人员揭示了H3K9me3修饰调控人类着床前胚胎发育的重要功能。研究表明,特定的KRAB-ZNFs蛋白可通过发育阶段特异性的H3K9me3修饰来调节不同LTR家族的转录。其中,在人类胚胎二细胞(2C)发育到八细胞(8C)期间,H3K9me3在类人猿特异性SVA_D反转座子上的沉积减少,有利于这些反转座子与合子基因组激活(ZGA)相关基因相互作用。进一步研究发现,SVA_D逆转座子可充当增强子为8C关键转录因子(如DUXA和ZSCAN4)提供结合位点来促进人类的ZGA。的确,SVA_D元件的表达沉默可阻碍ZGA和囊胚形成,揭示了SVA_D在人类着床前胚胎发育中的重要功能。此外,在胎盘滋养层中,H3K9me3的从头沉积可阻止多能性转录因子与某些类人猿特异性反转座子结合,抑制ICM谱系相关基因表达,表明H3K9me3重编程对人类胚胎早期谱系特化具有潜在促进作用。反转座子是否参与调控人类着床后胚胎中的谱系特化和胚层分化,有待于以后进一步研究。
逆转座子参与人类疾病发生
在正常生理条件下,转座子的转录活性受到人类基因组监控系统的严格控制,而在病理或衰老条件下则有可能发生失调。例如,人类特异性HERVK(HML-2)被报道广泛参肿瘤发生、衰老以及抗病毒先天免疫反应等多个生理过程。其中,HERVK(HML-2)在神经发育中的作用尤其引人