讲者
鲁伯埙
复旦大学生命科学学院教授
我先简单介绍一下我们研究的疾病。亨廷顿病是一种神经退行性疾病,大家可能熟知的神经退行性疾病有阿尔茨海默病,帕金森病等等。亨廷顿病相比其他两种疾病来说要更为罕见,是一种罕见病。另一方面来讲,它的遗传学机制更清楚一些。亨廷顿病主要是一个单基因突变所引起的神经退行性疾病,相对来说我们觉得它的致病机制和治疗手段更可能有研究上的突破。
CAG序列的重复数增多会带来这些疾病
引起亨廷顿病的突变基因是在1993年被发现的,这在当时具有里程碑式的意义。有100多个非常有勇气的科学家在委内瑞拉的一个小村庄找到了亨廷顿病非常大的家系,找到了致病基因,这个基因名字就叫做HTT。后来发现这个基因的突变和刚才杨力老师讲的大多数致病基因的突变不一样,它不是一个点突变,而是CAG的重复序列的重复数产生了突变。正常基因的CAG重复数小于36个,而在病人当中重复数大于等于36个就会导致疾病,很多研究发现该疾病主要致病原因可能是过长的CAG所编码的polyQ(polyglutamine,多聚谷氨酰胺)导致的。
在临床上,亨廷顿病的发病率在全球范围内大概是万分之0.5~1,发病后引起纹状体区域的神经退行性变,包括其他脑区也有一定程度上的退行萎缩,但纹状体区域非常明显。亨廷顿病引起的一系列临床症状包括不受控的运动,即舞蹈症,还有认知和心理症状。它的发病年龄一般是40~50岁之间,比散发的阿尔茨海默病或者帕金森病要早,与家族性的相比也并不是非常早。亨廷顿病还会引起过早死亡,所以这是一种非常严重的崩溃式疾病。由于它的致病基因非常明确,所以在临床上有些优势,比如说可以很早的进行诊断,同时它还有很好的遗传学模型,这都是更常见的神经退行性疾病所不具备的。
今天要探讨的问题是CAG重复。刚才提到了亨廷顿病有一个基因HTT,它的CAG重复数过多,超过36个的话会导致疾病。实际上这并不是唯一CAG重复过多会引起的疾病。在人类当中已经发现了很多种其他的疾病,它们有不同的基因都具有CAG的重复,也都是重复数超过一定的阈值会导致疾病,而且这个阈值大部分都在40左右。所以就有个很有趣的问题,为什么不同基因的CAG的重复数超过大约40的阈值就会导致疾病。
今天介绍我们近期发表的两个工作,一个是从蛋白的角度去思考,还有一个是从RNA的角度去思考。
构象的不同影响蛋白的降解速度
从蛋白的角度,为什么超过一定的重复数会导致疾病,有过两种主流的观点,其中有一种是我们参与提出的。更早的一种观点是所谓的线性栅格模型,也就是polyQ它本身形成了一定的线圈结构,它在野生型中和突变型结构单元是一样的,突变型因为polyQ过长,是比较小的单元的线性重复,所以叫线性栅格的重复。
为什么polyQ长了会导致疾病?这个观点认为,小的栅格会引起细胞应激,过长的话就会引起更多的细胞应激,最后导致疾病。相应的,有一种毒性构象浮现模型认为除了线性栅格之外,长的polyQ基因会呈现出不同的构象单元,与野生型的构象不同。这样的话,突变类型除了有线性栅格模型,可能还会有毒性构象浮现模型,而毒性构象浮现模型与野生型的构象不同,这可能是导致疾病的一个关键原因。但是这个猜想或者这个模型一直缺乏证据,已有的证据集中在体外层面。
我们设计了一个化学生物学的方法,可以在细胞里面检测不同抗体识别的不同构象的polyQ所对应的变异HTT蛋白在细胞里的降解速度。我们从逻辑上推断,假设两种不同的抗体识别的是不同的构象类型,那么我们分别去测量它们在同一个细胞里的降解速度,它们的降解速度就有可能是不同的。如果说我们测出来它们的降解速度完全相同,那么很有可能这两种并不是两种不同的构象,而实际上是同一种构象;相反的,如果我们测出来降解速率不同,那么这两种就必定是不同的构象。因为如果是相同的构象,它不可能有两种不同的降解速度,特别是在同一个细胞里面。
利用这种方法我们进行了很多测量,发现两种不同的抗体所识别的polyQ蛋白的降解速度总是有显著性的不同,不管用什么体系去测量。我们进一步发现,这种不同是有polyQ长度依赖性的,可以看到长的Q:100Q、73Q、46Q都有显著的不同,但如果降到23Q或者18Q的话,不同就消失了。那就证明是短的Q,也就是野生型的Q只有一种构象,或者说理论上我们没有办法排除只有一种构象,而长的Q很可能是有两种构象,至少有两种不同的降解速度。
我们进一步解析了为什么有不同的降解速度。简单的说,两种不同的降解速度源自蛋白被细胞内选择性自噬所识别的能力不一样,降解快的构象更容易被选择性自噬识别来降解,而降解慢的构象更不容易被降解。这些图都是为了证明这个结论。
为什么选择性自噬对蛋白的识别不同,我们发现因为它的K63泛素化是不同的。那么这种抗体识别的蛋白的K63泛素化是比较多的,而另一种是比较少的。相对应的,一个可以结合p62,也就是选择性自噬的受体,而另外一个不结合p62。那么这不只是在病人的皮肤细胞内发生,真皮细胞、成纤维细胞里面也有这个现象,而且在病人的大脑里面,在病人去世以后所提取的大脑组织也有完全一致的现象。所以证明了长的polyQ可能浮现了新的构象,并且新的构象的降解速度会变慢,原因是K63泛素化的减少和p62的识别减少。
我们看到在小鼠模型和青少年发病的病人样本中,蛋白的Q更长,这个差距更明显。简单的说,我们发现变异的亨廷顿蛋白在polyQ很长的时候存在不同的构象,而且可以用不同的抗体识别,其中3B5H10抗体所识别的类型不容易被K63泛素化,从而不容易被选择性自噬进行降解,从而可能毒性会更高。这是从蛋白的角度发现的一个可能,解释了为什么超过一定的重复数会导致疾病。
RNA的凝聚体影响蛋白合成
另外一个方面是从RNA的角度。其实是个挺意外的发现,源自我的两个学生几乎在同一天发现一个有趣的现象。当时是做一个对照实验,我们想测量疾病的细胞,亨廷顿病的纹状体的细胞和野生型的细胞,它们整体的蛋白质合成速度。然后发现很奇怪的是疾病细胞的整体蛋白质合成是比野生型要低很多的,用单细胞成像的方法可以看到完全一致的现象,差距是比较大的。
那这是什么原因呢?我们开始自然是考虑亨廷顿蛋白,但后来做了各种实验基本上排除了这个原因。最后发现引起合成速度低的原因不是蛋白,而是RNA。我们给RNA前面加stop,让它基本上不表达蛋白,发现短的CAG对蛋白合成没有影响,长的CAG表达了以后就对蛋白合成有影响。在其他的体系当中我们也发现类似的现象,特别是体外翻译合成荧光素酶报告,如果在这个体系当中加入72×RNA,它的翻译合成速度是明显下降的,而短的CAG重复的速度没有下降。这里面的RNA是没有5’端的cap,它不太能够形成蛋白,而且从时间上看非常短,起效也非常快。所以这个体系中,翻译的下降可以确定是由RNA引起的,而不是蛋白引起的,而且RNA的浓度也并不高,和估计的细胞内浓度差不多。各种证据表明是RNA导致了翻译速度的下降。
那么RNA为什么会导致翻译速度下降,为什么长的RNA会导致翻译合成抑制,而短的RNA不会导致呢?我们注意到一篇来自Ronald Vale团队的Nature论文,他发现RNA在重复很长的时候会形成相分离的凝聚体,而且这个凝聚体是一个胶体,或者说是一个近似于固体的状态,它的荧光漂白是没有恢复的,而短的CAG几乎不形成这样的凝聚体。长和短有个重要的区别,长的重复会因为分子间氢键的相互作用形成胶体一样的凝聚体,这个凝聚体在细胞内也能观察到,但主要是在细胞核里面,细胞质里面非常少。除此之外,细胞核里面的凝聚体被发现是液滴的状态,可以荧光漂白,可以很快恢复,和体外观察的胶体不一样。
根据他们的研究,我们就推测,长的CAG和短的CAG的RNA有个重要的区别,长CAG的RNA会形成核内的凝聚体,那么有没有可能是核内的液滴状的凝聚体,最后导致了蛋白质翻译的下降呢?我们做了非常多的尝试和假说,结果发现并不是这样。这本身有个挑战的地方,RNA的凝聚体是在细胞核里面,但实际上蛋白质合成是在细胞质里面。那为什么核里面的东西会影响细胞质里面的东西?当然有可能各种间接的影响,但是我们基本上都排除了。
所以我们退回一步,有没有可能CAG的RNA凝聚体不只在核里有,在细胞质里面也有。如果它对细胞质有影响,对蛋白质合成的影响就更顺理成章了,但是为什么我们却很难观察到细胞质里有凝聚体。然后我就有一个猜想:细胞质里可能形成了凝聚体,只是很快地被溶酶体降解了。我们发现果然是这样,如果加上溶酶体阻断剂,细胞质里面就出现了大量的凝聚体,用各种不同的方法都可以观测到。而且这些凝聚体和溶酶体都是共定位的,跟我们猜测它被溶酶体降解是一致的,使用不同的技术检测都有一致的结论。
然后,我们又研究凝聚体是怎么进入溶酶体的,发现并不是通过自噬进入溶酶体。如果敲除自噬的关键基因,观察到的凝聚体还都在核里面,不会跑到细胞质里面。相反,如果敲除溶酶体上的一个基因,这些凝聚体就跑到细胞核里,所以这些RNA的凝聚体是直接进入溶酶体的,不是通过自噬进入溶酶体。
我们发现细胞质里面这些凝聚体才是胶体,是荧光漂白不恢复的,而细胞核里的凝聚体是可以恢复的。
简单的总结一下,我们发现细胞质里可以形成RNA的凝聚体,这些凝聚体比较难观察到,因为它们很快被溶酶体降解了。有没有可能是细胞质里面的这些RNA的凝聚体形成了胶体以后,抑制了蛋白的合成?我们使用一些试剂去干扰这些凝聚体,发现翻译的速度果然恢复了。
反过来,我们建立一个光控的方法,用蓝光去诱导细胞质的凝胶化,发现照射蓝光的话,蛋白合成就被抑制了,证明了细胞质的凝胶化的确会抑制蛋白合成。
RNA形成凝聚体抑制eEF2蛋白功能
抑制蛋白合成的机制又很复杂。最后我们发现,它很可能是由于一个关键的蛋白eEF2,这是一个翻译延伸的蛋白,它被RNA诱导变成了细胞质里的凝聚体。
我们在病人的脑组织里可以看见形成eEF2的凝聚体,在小鼠的脑里面也可以看见,在正常人和对照的小鼠里面没有。而且作为对照,其他的影响翻译的蛋白像EF1a是没有这个现象的。在细胞还有小鼠模型中可以看到eEF2的凝聚体和RNA的凝聚体有非常强的共定位。而且如果在体外混合eEF2和重复扩增的RNA,可以看到它们在体外共同形成凝聚体,也就是RNA形成凝聚体的时候,可以把eEF2蛋白给抓进来。
我为什么说RNA是把蛋白抓进来,因为在没有eEF2的时候,RNA单独或与GFP一起的时候,它自己也可以形成凝聚体。但单独只有eEF2的时候,它自己是没有形成凝聚体的。所以这里相分离的主角不是蛋白,蛋白自己没有办法相分离,而是RNA自己就可以相分离,如果有蛋白的话,它会把蛋白抓进去,抓进去以后可以抑制蛋白的功能,而且可以把它给降解掉。
那么功能上是不是有eEF2的作用,我们在体外的翻译系统中加入了有功能的eEF2,发现可以拯救蛋白合成的抑制。
简单总结一下,我们发现RNA形成了胶状凝聚体,可以封存eEF2。eEF2被封存在里面后,使得能够行使翻译功能的eEF2减少,这个我们有实验证明。形成的这些凝聚体还会被溶酶体识别和降解,最终会引起一些神经相关的表现。
领取专属 10元无门槛券
私享最新 技术干货