摘要:我们今天的主题是罕见病,我认为基因编辑发展到现在,作用于罕见疾病是最好的,也是最早能实现真正应用的,碱基编辑技术是基因编辑技术大家庭里面的重要技术,我们的工作这几年也是围绕碱基编辑技术展开。碱基编辑技术发展到目前为止也是有它的一些问题,我们的工作也是希望逐步把
讲者
毕昌昊
中国科学院天津工业生物技术研究所研究员
瑞鸥科学创新联盟成员
我今天主要讲我们在单碱基编辑技术的研究中的一些工作,背景就不过多介绍了,今天下午大家得到了很多基因编辑方面的知识和它的来源。
今天反复说了碱基编辑基因,它最终核心的功能是用失活的Cas9蛋白把脱氨酶带到一个特定的位置,然后脱氨引起细胞的修复反应,最终可以完成一个单碱基的转换。
我们今天的主题是罕见病,我认为基因编辑发展到现在,作用于罕见疾病是最好的,也是最早能实现真正应用的,碱基编辑技术是基因编辑技术大家庭里面的重要技术,我们的工作这几年也是围绕碱基编辑技术展开。碱基编辑技术发展到目前为止也是有它的一些问题,我们的工作也是希望逐步把这些问题解决。
可对任何gRNA效率进行预测的模型
第一个问题是编辑种类有限,刘如谦教授最先发展出来了胞嘧啶编辑器(CBE)和腺嘌呤编辑器(ABE),大家可能都比较熟悉了,在碱基编辑完全的情况下,是12种转换,4种碱基任意转换是12种,目前它实现了4种转换,还有8种没有实现,期待后面的工作能够让它们实现,我们在这里面贡献了我们的一些力量。
其它碱基编辑还存在的问题:它叫单碱基编辑器,但是其实也存在一个比较严重的情况也就是Bystander Editing,它会编辑目标碱基旁边的碱基,我们中文叫“旁观者编辑”。这个我们也希望它真正能够精确到目标碱基,几乎所有的罕见病和疾病产生都是单位点,我们希望非常精准的单位点纠正或者是建模,所以单窗口也是很重要的。
其它还有我们提到的效率,目前为止我们如果想去治疗一个疾病,一定要先做细胞再上动物模型或者类器官模型,然后成药。这方面的应用目前也是相对滞后,我们的工作大概集中在这几个方面。
首先,我们研究组第一个相对比较重要的工作是碱基转换、碱基颠换的编辑器GBE,这也是在刘如谦教授CBE的基础上发展起来的,CBE就是把胞嘧啶脱氨酶带到特定的位置,对胞嘧啶进行脱氨,形成了尿嘧啶U,U在碱基配对中被认为是T或者它在复制中会引起一些修复,最终变成C到T这么一个转换。
如果把这个变成尿嘧啶U,再把它通过糖基化酶从DNA双链上的骨架上切除掉,就会形成一个没有嘌呤和嘧啶的AP位点。这样诱使了新的一种和之前的胞嘧啶只是脱氨不同的DNA修复机制,一般来说我们认为这个DNA LTS引起的修复,我们就按照这个去做,最终开发出可以把C特异性转变成G的GBE的碱基编辑器。
在这个基础上我们也是做出了第二代的GBE碱基编辑器,主要优化的过程选用了功能更强、活性更高的尿嘧啶糖基化酶,在编辑器两个蛋白中间的Linker做出了优化,它的构象做出了优化。当然David Liu和J.Keith Joung研究组同时做了CGBE,他们也做了第二代。我们第二代跟他们的第二代相比,性能还是比较领先的,这个是我们当时的工作。
另外我们知道无论在基因编辑还是在碱基编辑里面,重要的一环是设计gRNA,gRNA设计的好坏,我们选择的靶点是非常重要的。可能对于我们中有经验的是相对容易一些,但是对于新手去使用还是有一定的困难。所以我们针对gRNA,对GBE设计了深度学习模型,做了高通量的编辑,然后把数据收集起来给深度学习的模型或者是AI模型进行学习,学习以后我们就可以生成权重图,告诉大家这个gRNA在目标范围内哪些碱基组成有利于效率提高,哪些是不利于效率提高的,我们做了优化。
另外我们通过构建机器学习的模型,对于任何的gRNA可以进行预测。任何的gRNA你可以预测它的效率高低,你可以多选择几个,在你进行真正的实验之前获得一个高效率的gRNA。
这个是我们的工作,解析了碱基编辑,这个做的人还是相对少一些,因为我们知道无论是碱基编辑还是CRISPR/Cas9第一代的编辑器,我们的作用是对DNA双链进行一个扰动或者是一个破坏,所有的这些编辑结果不是直接的结果,而是通过触发哺乳动物细胞的修复系统,最终修复完成以后获得了DNA形态的编辑结果。
我们这个工作通过和哺乳动物细胞高度同源的酿酒酵母细胞来完成,它们都是真核,对酿酒酵母细胞进行大量的基因敲除,我们可以获得一些重要的,在修复过程中发挥作用的酶,然后有一个相对完整的分子机理解释了GBE最后由胞嘧啶转化成G,是怎么形成的这么一条机理。别的老师也做了双碱基编辑器。
效率和专一性提高,窗口可调整的第二代编辑器
我们研究组的第二个重要工作,也是在今年在Nature Biotechnology杂志发表的,我们开发了我们自己称为的第二代碱基编辑器,我们称为糖基化酶碱基编辑器。刚才老师也反复提到碱基编辑器目前它的效率很高,但是它有很多脱靶,首先我们自己在实验中发现胞嘧啶编辑器它的脱靶非常厉害,而且这个脱靶不依赖Cas9。
目前可能要做一个解释,脱靶有两种。一种是由于Cas9蛋白本身对不同序列的容忍性,它不是100% match(匹配) gRNA的位置,它也会进行编辑,这是Cas9依赖性脱靶。但是我们现在使用的脱氨酶,尤其是胞嘧啶经过进化后,它的活性非常强,所以它可以在全基因组中造成随机突变,而且这种造成的脱靶是很难预测的,有些文章发现它的危害比较大,所以第一点我们希望避免全基因组的脱靶。可能从根本来解决这个问题,就是不要脱氨酶了,至少能解决全基因脱氨的问题,全基因把胞嘧啶转化成尿嘧啶。
我们想直接用糖基化酶在DNA单链上,把胞嘧啶或者是其它的碱基直接切除,这样我们就绕过了下面虚线这块。可以看到之前是先脱氨,然后再把尿嘧啶或者是次黄嘌呤切除,通过糖基化酶,绕过这一步,我不脱氨,直接在单链上,不通过脱氨酶直接去除,就可以把脱氨这一步绕过去。
非常遗憾的是自然界中不存在活性这么强的糖基化酶(针对胞嘧啶),我们是希望开发针对胞嘧啶和胸腺嘧啶的,为什么呢?因为目前没有从胸腺嘧啶T出发的碱基编辑器。所以我们想通过这个工作,第一是避免脱氨酶,第二是增加碱基转换的方式。这两种糖基化酶自然界中不存在,因为我们是一个以微生物为中心的研究组,所以我们就在微生物里面,在大肠杆菌里面设计了一个突变系统,或者叫筛选系统更为确切一些。我们构建了糖基化的编辑器,它的活性非常低,但是它必须在有活性的情况下,把我们设计好的色氨酸突变体恢复成正常的色氨酸合成酶,这样大肠杆菌才可以合成自己的色氨酸,使得它能在简单培养基中存活。
有了这么一个和生长偶联的筛选系统,我们就可以非常精细的筛选非常多的突变体,我们就构建了突变体库进行筛选,而且它可以是一轮一轮的筛选,一开始我们可以筛到一个活性,但是这个活性非常低,我们把活性低的再进行突变,再进行下一轮筛选,这样有可能我们获得活性越来越高的突变体。
也是非常幸运,大概我们做了接近一年半的时间,不停的突变筛选、突变筛选、一轮一轮的,在分别经过25轮和33轮筛选以后,我们获得了活性相对来说比较高的胞嘧啶糖基化酶,直接能切除,和胸腺嘧啶的糖基化酶。
有了糖基化酶以后,我们由于是在大肠杆菌中筛到的编辑器,下面进行的功能就是希望把酶活带到哺乳动物细胞中,首先经过密码子优化,再经过一些结构的调整,经过一些编辑器的优化,我们就获得了第一代糖基化酶编辑器。可以看到C到G编辑还是非常有特异性的,我们测试的位点基本能达到40%左右的编辑效率,应该说在碱基编辑器上中等优秀的效率,是可以和目前比较流行的CBE和ABE相提并论的效率,而且它T到G碱基编辑器的窗口还是比较窄的,更适合我们应用到遗传疾病、罕见病领域。
获得了第一代糖基化酶碱基编辑器以后,我们同样经过了后面这些优化,主要是通过刚才提到的Linker的长度,两个Function Group相互作用,经过这些优化获得了第二代,它们和第一代不同的是效率和专一性得到进一步的提高,但是窗口发生了改变。窗口是可以调整的,所以也是得到了更优秀的第二代编辑器。
可能有的同学后面会提问,既然目前已经有了Prime Editing引导编辑,它可以实现所有类型的碱基转换,为什么我们还要来做碱基编辑器呢?我们和PE进行了比较,选择的点不是特别多,随机选择了一些大家常用的测试位点,可以看到有一些位点里面,还是目前PE最好的PE5,PE5max的效率是超过TBE的。但是在有的位点,比如说PSMB2-1这些PE的效率非常低,我们几乎看不到Prime Editing的编辑效率,但是我们的碱基编辑器整个来说在绝大多数位点,它的表现是比较均衡的,都能得到一个相对满意的编辑效率,和PE的比较也是证明了这一点,这是通过编辑器不同的特点来决定的。
我们非常高兴能看到的是对ABE来说,RNA的脱靶我们没有观察到。对CBE来说,DNA全基因组脱靶在我们的测试下,也是在信噪水平以下的,就是说也没有检测到,证明我们第二代糖基化酶碱基编辑器整个安全性还是优于第一代的碱基编辑器。当然了可以看到我们的效率还是稍微低于,目前效率最高的CBE和ABE编辑器,现在我们仍然在继续进行优化,希望下次报告能给大家带来更满意的糖基化酶碱基编辑器。
可直接使用的最佳gRNA数据库
下面由于时间关系,我就不再做过多赘述。比如说单窗口编辑器,我们发现gRNA,如果100% match的情况下,确实Bystander(旁观者编辑)的情况特别多,而且我们观察了这种Bystander的积累是和时间相关的,我们假设这种Bystander是因为Cas9对mismatch gRNA的Tolerance(容忍性),相当于是类似脱靶的一个效应。
我们一开始就在gRNA引入了一个不是100% match的位点,我们称为imperfect gRNA,我们发现用了这种gRNA以后,它的Bystander确实大大降低了,而且on target的单碱基效率是有提高的。我们这个工作也是在很多位点进行了一些验证,发现确实是这样的。
但是我们目前也没有找到什么样的mismatch是一个最好的效果,所以对大部分使用者来说还是需要先建一个小的库,来测试不同的mismatch gRNA,看哪个效果最好,但是对很多使用者来说可能是比较麻烦的。因此我们又用了高通量的方法,因为我们目前很多遗传疾病的这些位点,就SNV是已知的,在ClinVar的数据库里面,目前已知是有37000多种,但每天都在增加。
我们针对这种ABE纠正SNV,我们把所有这些位点都克隆了出来,放到慢病毒,然后整合到细胞里面,对这样的细胞库进行高通量的编辑,并收取数据,每一个位点我们使用了一组20个mismatch gRNA,所以目前收集完数据,我们就可以对所有的疾病位点求出最佳gRNA,当然在我们这篇文献里面就给出了一个目前效率最高,Bystander Editing最低的gRNA,只要登录数据库,大家可以直接看,如果需要的话可以直接使用,是这么一个工作。
全自动细胞编辑——两星期几千个编辑
后面我们对gRNA进行改造,我们发现gRNA很多会在公司去定制,对它进行化学修饰,但其实如果我们用比较简单的方法,无论是在体外使用还是体内使用,比如我们用引用内含子的剪切机制或者是一些病毒的剪切机制,使它环化以后,稳定度就能大大提高,作用就是能够提高编辑效率,在体外能够观察到稳定度有很大的提高。
我们也是通过基因编辑的方法,利用了我们研究所一套全自动(系统),之前是用在微生物细胞工厂构建的一套系统,叫做生物铸造工厂。通过这套全自动的系统,我们目前可以实现全自动的细胞编辑,大概在两星期内可以实现大概几千个哺乳动物细胞的基因编辑,但前提是我们这个转化系统的效率要足够高,如果在足够高的情况下,我们可以实现以下步骤的全自动化:1、引物池的全自动构建;2、引物池构建后,全自动的获得编辑指令的库,这个指令的库是放在384孔板;3、可以自动进行细胞的转化;4、细胞转化后可以完全全自动的获得每个编辑好的细胞并且测出编辑效率。
如果我们想拿到一个特定编辑的细胞,后续操作如从384孔板上取出细胞进行单克隆的分离仍需人工完成,但整个编辑是全自动完成的。通过这套系统,我们首次能够获得大量的,也不是特别高,但能获得几千个原位的编辑效率,这样我们回过去可以使用AI的模型学习gRNA和编辑效率之间的关系。
我们放进了第三个预测的因素,染色体的可及性,模型输入的是gRNA序列染色体可及性,预测的是编辑效率。这个模型目前R值还是可以的,预测结果是大概准确的,还达不到基本准确的程度。
另外还得到一个有趣的数据,我们算下来染色体对编辑效率的影响和gRNA序列对编辑效率的影响在碱基编辑器CBE上是1:5的比例,也就是说染色体可及性平均对编辑效率影响是1/6,这是从我们的数据推测出来的数据。
最后一点,通过这个工作我们发现很多细胞因子对这种碱基编辑效率有很大的影响,因此我们也筛选了很多细胞因子,看它对碱基编辑的影响。我们发现有一类在复制转录前能称为“先锋因子”,这类对细胞编辑有很高的促进作用,因此构建了融合细胞因子的编辑器,效率得到了一些提高。
同样这类细胞因子我们把它融合到PE系统,发现在PE系统里,这个效率有比较大的提高,尤其对PE3、PE5,就是同时用两个gRNA来进行编辑,两条链都切割的PE编辑系统。我们可以把这种招募机制放在非模板的RNA、非PEG(聚乙二醇)的普通RNA上,这样的效率比原始的PE3、PE5系统又有了比较大的提高。
眼科疾病的治疗应用
最后是应用方向,也是和今天的主题可能最契合的一个案例。这是一个人眼睛色素变性的案例,可以看到正常人的序列,野生型一个精氨酸,GCG编码的精氨酸,但是在突变体里小鼠模型RD10,这个精氨酸被突变成GCA,这是人真实存在的疾病案例,这个精氨酸突变成半胱氨酸后,PD6B这个酶的活性就被破坏了,这个酶在我们视网膜光信号、化学信号的传导过程中是一个核心的酶,它被破坏后有毒的中间体会积累,损坏视网膜神经,一般来说会造成失明。
对碱基编辑来说要治疗这个疾病很简单,原理是很简单,刚才各位老师也提到我们把GCA的A用ABE的碱基编辑器纠正成GCG的G,A到G的纠正,这个疾病就得到了治疗。它的重点,首先第一步我们要优化这个编辑器。我们在一个模式细胞,常用的293细胞,在这里面我们做很多实验,把这个编辑器的效率优化,通过gRNA的选择,编辑器的优化,编辑器蛋白序列的优化,编辑器的选择,最终我们做到最高的水平大概是60%左右的编辑效率,100个细胞有60个被完全编辑。
有了这么一个优化好的编辑器后,由于AAV的容量有限,必须把它拆分成两个,分别放到两个AAV载体里,递送到晶状体,我们把它注射到小鼠的视网膜中,大概在第14天进行注射,最后进行功能的验证。
我们在收取小鼠进行功能验证时,基因组的编辑效率能达到20%左右,但是cDNA也就是真正发挥作用的编辑效率可以达到40%,40%是否能够真正的恢复小鼠的视觉功能,这就是它病理学、行为学还有光电学的分析。
(图上)左边是Untreated对照组,可以看到外核层几乎没有生长,因为是有病的受到了严重的抑制,但是在被注射的区域这个外核层长的就比较好,下面这个图是跟它对应的,光电图就没有放到这里,对光线的响应也得到了极大的恢复。
(图上)右上角是非常经典的水迷宫实验,可以看到野生型的小鼠非常容易的就能找到水迷宫里的浮台,但是两组对照组没有办法找到,经过我们治疗的A7小鼠是能够找到的,虽然没有野生组这么快,但它是个例。下面是我们整个的分析,我们发现在对照群落里,Treated组对照Untreated组,确实行为学得到了很大的恢复。
这是我们一个重要的应用,眼科肯定是最好的遗传疾病治疗,还有市场化率很好的突破口,其他的疾病我们也在积极的和合作者推进。
最后感谢我们合作的(单位),比如上面的这些工作是和上海第一人民医院孙院长团队合作完成的,还有我们的基金。另外我们也寻求合作,也在招聘博士后,谢谢大家。
校对 | 钟惠
来源:苏子科学资讯