移位的PAMs产生DNA悬垂,并增强SpCas9催化后复合物的解离
利用Sanger测序和DNA切割反应的高通量基因组测序,我们发现化脓性链球菌SpCas9复合体对内部机械应变的响应是通过产生悬垂而不是钝的DNA末端分布来实现的。内部机械应变是通过移动(增加或减少)RNA-DNA杂交体与下游规范PAM之间的间距产生的。通过增加混合物和PAM之间的距离,可以健壮地产生多达2碱基3 '的悬垂。我们还利用单分子实验实时重建了CRISPR-SpCas9反应的全过程,从结构和动力学上监测和量化了r环的形成、第一次和第二次dna切割事件以及催化后复合物的解离。复杂的解离和断裂DNA末端的释放是反应的限速步骤,移位的SpCas9被充分不稳定,从而在断裂DNA末端形成后迅速解离。
CRISPR是一种细菌和古细菌的适应性免疫机制,通过调动Cas蛋白,引导rna相互作用,识别和切割侵入性dna 1,2,3,4。SpCas9是II-A型CRISPR-Cas家族的一员,已被广泛用于编辑原核生物和真核生物的基因组5,6,7。SpCas9是一个约160 kDa的单蛋白,具有二价离子依赖的HNH和RuvC核酸内切酶结构域。SpCas9可以结合由CRISPR RNA (crRNA)和反式激活CRISPR RNA (tracrRNA)组成的双引导RNA (dgRNAs)。crRNA和tracrRNA配对形成核糖核蛋白(RNP)。tracrRNA由86个核苷酸(nt)组成,促进~40-nt的crRNA8的成熟。tracrRNA的5′区和crRNA的3′区通过互补碱基配对形成dgRNA,在实践中,tracrRNA和crRNA可以被工程化形成单导RNA (single guide RNA, sgRNA)5。引导RNA的~ 20nt间隔段取代了非互补DNA链,并与互补DNA链的原间隔段杂交形成r环。Cas9的pam -相互作用域(PID)9扫描非互补链上的NGG pam,也被发现对R-loop的起始和延伸至关重要10,11,12。在r环形成过程中,靶DNA和dgRNA-SpCas9发生了戏剧性的有序构象变化11,13。在DNA和dgRNA-SpCas9之间的催化前复合物形成之初,HNH内切酶结构域与r环对齐,而RuvC内切酶结构域则在催化复合物成熟后期定位于面向HNH位点的非互补链上14。
早期的结构和单分子研究已经揭示了NGG PAM在调节SpCas9催化活性中的重要性10,以及对引导RNA碱基之间核苷酸错配的耐受性差,引导RNA为r -环提供种子15。然而,PID可以被设计成显示一定程度的可塑性- ngan, NGNG, NGCG和NAAG PAM变体已经在SpCas9突变体中被表征16,17,并且由野生型SpCas9形成的脱靶双链断裂(dsb)与PAM变体如GAG或aag相关16,19。
在这里,我们发现SpCas9通过产生悬垂的dsb来响应crRNA-DNA杂交体和PAM之间间隔的几个核苷酸偏移,并且这种“移位-PAM”靶向被生理水平的DNA超缠绕增强。我们通过对集合生化和细胞实验中形成的DNA末端结构进行检测,并通过单分子实验来探究SpCas9的催化机制:r环形成、第一次和第二次DNA切割事件以及切割后复合物与DNA的解离,得出了这一结论。
我们使用规范和移位- pam引导rna诱导合成基因内的切割20。我们首先设计了一个典型的crRNA,靶向一个20-nt的原间隔物,其一致的NGG PAM位于合成基因的编码链上(S1_T0 crRNA)。然后,我们设计了20 nt的shift-PAM crRNA,靶向典型S1_T0 crRNA靶标(S1_T1, S1_T2, S1_T3和S1_T4 crRNA)上游碱基对增量的DNA。为了控制裂解,我们检查了非编码链上的两个常规靶向SpCas9位点(S2_T0和S3_T0)(图1a和扩展数据图1a)。将各种crrna与保守的tracrrna杂交形成dgrna,随后与SpCas9结合形成酶促dgRNA-SpCas9 RNP复合物。为了评估存在或不存在超卷的DNA链切割活性,将差异靶向dgrna - spcas9添加到超卷或sbfi线性化的~ 5kb双链DNA底物中,然后使用凝胶电泳评估单链或双链切割(见方法)。
图1:通过改变杂交靶与PAM之间的间距获得的SpCas9切割。
a,在杂交目标和PAM之间具有典型(S1_T0 SpCas9、S2_T0 SpCas9、S3_T0 SpCas9)或移位-PAM间隔(S1_T1 SpCas9、S1_T2 SpCas9、S1_T3 SpCas9、S1_T4 SpCas9)的RNPs靶向的DNA位点。蓝色箭头表示每个RNP的20-nt靶向区域,洋红色矩形表示NGG PAM。b,具有典型或移位- pam间隔过程的RNPs首先将超螺旋DNA (SC)靶向成缺口开环DNA (OC),然后再靶向成线性DNA (L)。c,与b中一样,但线性DNA底物(L)被加工成两个cleaved产物(CLV)。d,圆形DNA(红点)和线性DNA(蓝菱形)定量切割的归一化效率,带有误差条(s.e.m., n=3)。e、f、LAM-HTGTS IGV绘制HEK293T细胞RAG1位点的IGV图,分别使用两种不同的T0- pam向导作为诱饵(红色鱼叉),诱饵- l (e)和诱饵- a (f),获得CTR(单独诱饵)或T0、T1和T2向导分别产生RAG1B、RAG1C和RAG1D位点的DSB谱。右侧面板显示RAG1D和RAG1C靶点的放大图(左侧虚线框)和结数。虚线表示T0、T1和T2目标的峰值。图以自定义的0,20,200刻度显示正(红色)和负(蓝色)染色体方向。补充表1列出了文库中的连接总数和每个诱饵的复制数据。
源数据。
正如预测的那样,常规靶向RNPs (S1_T0, S2_T0和S3_T0)在3小时内有效地切割了超卷曲和线性DNA底物的DNA链(图1b-d)。出乎意料的是,shift-PAM RNPs (S1_T1和S1_T2)对超螺旋底物产生了稳定的dsb水平,与在常规靶向对照中观察到的水平相当(图1b,d)。随着移位- pam间距的增加,双链切割效率逐渐降低,S1_T3和S1_T4 RNPs的切割(缺口)片段与线性化片段的比例增加(图1b,d),反映了部分加工中间体的积累。与超卷曲底物相比,线性化底物的切割效率下降更为明显:S1_T1 SpCas9 DSB切割线性DNA与超卷曲DNA无法区分,而S1_T2 SpCas9 DSB切割明显减少,S1_T3和S1_T4 RNPs几乎检测不到切割(图1c,d)。总的来说,PAM和rna靶向序列之间间隔的增加通常在超卷曲DNA上比在线性化DNA上更能被耐受,这与在负超卷曲DNA上间隔的突变更能被耐受的方式类似。
为了更好地了解shift-PAM切割在不同序列背景下是如何变化的,我们使用实现2碱基对(S4_T2, S5_T2, S6_T2)间隔的crRNAs在另外三个位点靶向超螺旋和线性DNA(扩展数据图1a)。S5_T2 SpCas9复合物对超螺旋DNA底物的作用较强,但对线性DNA底物的作用较弱,正如S1_T2 SpCas9所观察到的那样。S4_T2和S6_T2 RNPs表现出极端相反的活性,前者在超卷曲和线性环境下都能稳定地生成dsb,而后者仅轻微地切割超卷曲DNA(扩展数据图1b-d)。我们还研究了当20 nt目标序列以碱基对增量向PAM靠近时,SpCas9是否会切割DNA链。因此,我们还生成了S1_T-1和S1_T-2 crRNAs(扩展数据图1a),并在上述集成分析中对它们进行了分析。对于超卷曲底物,我们发现S1_T-1 SpCas9产生强烈的DSB,而S1_T-2 SpCas9产生低DSB,并且这两种活性在线性底物集成中都减弱了(扩展数据图1b-d)。总的来说,我们的结果表明,当DNA底物超卷曲时,当目标序列和PAM在任何方向上偏移最多2 bp时,SpCas9能够切割两条DNA链。
超螺旋DNA切割的时间过程表明,典型靶向RNPs (S1_T0, S2_T0和S3_T0 SpCas9)在几分钟的时间尺度上迅速达到DSB饱和。一般来说,位移轻微的shift- pam靶向RNPs (S1_T1、S1_T2和S1_T-1,但不包括S1_T-2和SpCas9)的DSB形成动力学与常规靶向RNPs相似,而位移较大的shift- pam RNPs (S1_T3和S1_T4, SpCas9)在3小时内缓慢积累DSB(扩展数据图1e)。
我们推断,如果移位-PAM机制依赖于附近的规范PAM,那么NGG PAM的突变将消除移位-PAM靶向RNPs的DSB切割活性。事实上,在S1位点突变PAM的两个鸟嘌呤会破坏超螺旋和线性化DNA底物中所有常规和移位PAM靶向RNPs产生dsb的活性(扩展数据图2a-c)。虽然在S5_T2中获得了相同的结果,但S4_T2需要额外的突变来去除替代PAMs16以完全消除DSB切割(扩展数据图2d,e)。接下来,我们研究了使用S1_T2 crRNA导致的2-nt偏移序列的变化是否会影响DNA加工。将与典型PAM相邻的第一和第二腺嘌呤突变为T、G或C并不影响S1_T2 SpCas9对DSB的切割(扩展数据图2f, G)。因此,移位-PAM靶向严格要求规范PAM的贡献,并在非互补链上施加额外的应变。
单链断裂在PAM间距为3 - 5 bp的超卷曲DNA底物中积累,表明HNH或RuvC结构域可能是产生这种断裂的唯一原因。为了验证这一点,我们使用了两种广泛使用的酶,SpCas9-D10A和SpCas9-H840A, SpCas9-D10A具有催化活性的HNH结构域,但RuvC结构域已死(记为HNH- spcas9), SpCas9-H840A具有催化活性的HNH结构域,但RuvC结构域已死(记为RuvC - spcas9)。随着间距最初的增加(S1_T0, S1_T1, S1_T2), HNH-SpCas9对衬底的强划痕能力不受影响,但这种活性在S1_T3间距时下降了大约三倍,在S1_T4间距时衰减到几乎为零(扩展数据图3a-c)。RuvC-SpCas9的间距依赖切口表现出稍微复杂的模式,从S1_T0到S1_T1间距增加,但随着间距增加到S1_T4,切口逐渐衰减,但仍保持在S1_T0观察到的水平的60%左右(扩展数据图3a-c)。总的来说,我们发现HNH结构域对超螺旋衬底的切割在S1_T2间距内是稳健的,但在此之后就会变慢,而RuvC结构域的切割在相同尺度上对增加的间距更具容忍度。将两个突变体与野生型SpCas9中观察到的间距增加的切口模式进行比较(图1b),我们注意到,从S1_T2增加到S1_T3,野生型酶对超螺旋底物的切口也显著下降了三倍,这表明HNH切口在DNA加工对间距增加和DNA超螺旋增强的响应中起主导作用(图1d和扩展数据图1a,c)。
为了确定间隔SpCas9切割是否可以在人类细胞中检测到,我们首先使用它敲除K562-iCas9-GFP细胞中的GFP。首先,我们使用RAG1位点(RAG1L_T0)中的一个通用规范靶点作为阴性对照,比较了canonical (GFP_T0)和shift-PAM (GFP_T1, GFP_T2)指南的敲除效率。GFP_T1的敲除效率(~45%)略弱于GFP_T0(~55%),而GFP_T2的敲除效率为边际(扩展数据图4a,b)。其次,我们在HEK293T细胞中使用高通量全基因组易位测序(线性扩增介导的高通量基因组易位测序(LAM-HTGTS))22,比较RAG1位点(RAG1B, RAG1C和RAG1D)18中三个典型靶向(T0) SpCas9猎物dsb及其移位- pam1靶向变体(T1, T2)的易位,使用位于SpCas9猎物dsb 1kb内的两个独立的典型靶向诱饵dsb(诱饵a和诱饵l)(图1e,f)。从这两种饵料中,我们从RAG1C_T1和RAG1D_T1(但不是RAG1B_T1)中恢复了数百个易位,这些易位与RAG1C_T0和RAG1D_T0猎物位点恢复的易位水平相似或略有降低(图1e,f和补充表1)。值得注意的是,在t1靶向SpCas9猎物dsb中观察到的互补链断裂点的易位峰相对于T0间隔观察到的易位峰移动了1bp(图1e,f)。在这一系列的位点上,我们没有观察到RAG1B_T2和RAG1C_T2的易位,但却观察到RAG1D_T2的易位,并且互补链上相应的易位峰显示出相应的2 bp移位(图1f)。使用RAG1D_T0作为诱饵(诱饵- d)的另外五个常规和移位pam靶向位点(rag1k - rag10)显示出类似的T0和T1谱,只有RAG1L_T2形成大量易位(扩展数据图5a和补充表1)。在所有条件下,诱饵-猎物LAM-HTGTS实验通常表达相当水平的SpCas9蛋白(扩展数据图5b)。因此,T1和T2移位- pam靶向的dsb可以在细胞中形成,其水平低于它们的常规靶向对应物,但足以通过易位检测到。
SpCas9产生的dsb主要被描述为钝端52,23,但也可以在细胞中产生具有短5 '悬空的dsb 24,25,这可能是由于随着时间的推移,非互补链上的切割位置变化增加5。然而,尚不清楚使用移位- pam间隔位点的裂解产物是否会主要承受钝端或悬垂。为了避免细胞中存在的广泛的末端处理,我们结合使用了两种Sanger测序方法,in - del和5 '定位(扩展数据图6a),以获得生物化学分析中具有移位- pam指南的RNPs末端结构的可能性(扩展数据图6b-j和补充表2)。in - del方法旨在捕获每个靶向DSB的插入、删除或直接连接。5 '定位利用上游SbfI位点来识别SpCas9 RNP产生的5 '端(扩展数据图6a)。
使用这些测序方法,在所有分析的实例中,互补链上几乎所有的切口位点都在20 nt靶向序列5 '端的第17位被鉴定出来(扩展数据图6b-j和补充表2),即使杂合体以碱基对增量从PAM移开,也能准确地定位在RNA-DNA杂合体中。非互补链上的切口位点相对于PAM位点也保持了高达2 bp的位移(如S1_T0、S2_T0、S1_T1、S1_T2和S5_T2),而超过一半的S4_T2观察到的切口位点移动了1 bp。然而,S1_T3 RuvC - spcas9切口混杂分布在3-bp间隔区,也与HNH切割位点对齐,而S1_T4 RuvC链切割几乎完全与HNH切割位置对齐(扩展数据图6b-i和补充表2)。因此,S1_T0和S2_T0靶点末端钝,而大多数S1_T1、S1_T2、S4_T2和S5_T2靶点末端有1-2-nt 3 '悬垂。S1_T3产生悬垂和钝端混合,S1_T4产生钝端。这让人想起早期的研究,在生化分析中证明了嗜热链球菌LMG18311 (LMG18311 Cas9)介导的shift- pam介导的裂解26。
因此,我们还研究了将RNA-DNA杂交体移向PAM是否会产生5 '悬垂;然而,S1_T-1靶向几乎完全导致了距离PAM 2bp的钝端(扩展数据图6j),表明HNH靶向产生了空间位阻。非模板链在S1_T3、S1_T4和S1_T-1中位置切割的改变表明,RuvC内切酶活性不需要与PID识别的NGG序列一致间距。这些综合观察结果表明,shift- pam靶向的SpCas9切割依赖于dna介导的诱导契合机制。
为了动态表征shift-PAM靶向RNPs的dna加工步骤的连续性,并将其与常规靶向RNPs的加工进行比较,我们进行了基于磁阱的单分子分析(图2a)。单个DNA分子含有目标序列,一端带有生物素标签,另一端带有地高辛(dig)标签,首先附着在链霉亲和素涂层的磁珠上,然后沉积在抗dig涂层的玻璃载玻片上并附着在上面27。将载玻片放在显微镜下,用两块磁铁对磁珠施加力并使其旋转。对头部在表面上方的位置进行成像,可以实时测量DNA的延伸和构象。对于给定的、低的、固定的力(此处的测量值为F=0.2 pN),扭转松弛DNA的延伸表示最大值(扩展数据图7)。超卷曲DNA使其紧致,在磁阱中观察到,这是头部高于表面的“高度”降低。DNA切割导致超级线圈的突然丢失,没有超级线圈,DNA不再紧密,头部恢复其扭转松弛状态的位置。在测定的初始校准步骤中,不紧凑型超卷曲的DNA分子被预先刻划,并从分析中排除。
图2:SpCas9偶联cano对催化前和催化后步骤的实时观察规范和移位- pam指南。
a-c,实验采用S1_T0 SpCas9 RNPs。a、试验示意图。SpCas9 RNPs是在非允许条件下引入的(正超卷绕),并且(1)通过在DNA中产生8个负超卷绕来启动活性(见方法和扩展数据图7)。(2)检测到r环的形成是DNA延伸的增加,随后是(3)DNA超卷绕的丧失。b、该分析的典型时间轨迹。洋红色条突出了DNA正超旋的阶段,用于RNP注射;顺时针方向箭头表示DNA负超盘绕开始反应的时刻,橙色条表示DNA负超盘绕的阶段。带有垂直箭头的磁珠表示磁珠的不可逆损耗。虚线是在不同状态下突出显示头位置的参考线,包括初始负超卷曲状态、R-loop状态和扭转放松状态(超卷曲丢失,蓝色箭头)。时间轨迹y轴被标记为使表面上方的最大头位置设置为零,并且较低的扩展被报告为负值。c,形成r环的分子的比例继续显示终端头损耗(监测超过7,200 s)。后续行的结构与包含a-c的初始行相同。在d - f中,使用了s1 - t1 SpCas9,因此我们现在经常观察到磁珠的不可逆损失(在图d中描述为步骤4,在图e中表示为垂直箭头顶部的磁珠);g-i中,S1_T2采用SpCas9;j - 1中使用S2_T0 SpCas9。m,启动RNP活动后事件的时间轴总结以对数标度显示:r-环路形成所需的平均时间(
,绿线),观察r-环路形成后超级线圈损耗所需的平均时间(
,蓝线),观察超级线圈损耗后磁珠不可逆损耗所需的平均时间(
,红线(量化),红色虚线(估计))。具体数值见补充表3。
源数据
由于正超卷曲的扭矩抑制r环的形成,RNP注入发生在以1pn力延伸的正超卷曲DNA上。注入RNP后,将作用力减小到0.2 pN,在DNA上施加8个负超线圈,启动SpCas9 RNP动力学的单分子检测:r环形成(表现为DNA解绕21,如图2b、e、h、k和扩展数据图7b、d(状态vii)),单链DNA切割(表现为超线圈的突然丧失28,如图2b、e、h、k和扩展数据图7b、d(状态viii)中的蓝色箭头),以及双链DNA断裂(表现为磁珠的末端丧失29,如图2e、h和扩展数据图7b、d(状态ix))。使用这种分析,我们可以指定形成r环所需的等待时间(
,处于状态vi的时间),从r环形成到超级线圈耗散所花费的时间(
,处于状态vii的时间),以及从超级线圈耗散到磁珠的终端损耗所花费的时间(< tbeadoff >,在状态viii之前花费的时间,在此时间点磁珠丢失)。
这些测量的第一个关键观察结果是,从S1_T0到S1_T1再到S1_T2的距离逐渐增加,导致
逐渐增加,而
逐渐减少(图2b、e、h、m,扩展数据图8a-c、e-g和补充表3)。
的增加与shift-PAM SpCas9-DNA复合物中机械应力的增加增加了能量成本,从而增加了形成R-loop状态所需的时间这一概念是一致的。
的减小表明机械应力复合物导致超级线圈耗散更快。这可能是由于单链切口更快的动力学,或者是由于压力复合物“抓住”切口两侧DNA的能力降低,以防止DNA自由旋转和消散超级线圈。
与这种替代解释一致,第二个关键观察结果是,对于典型的S1_T0和S2_T0 SpCas9 RNPs, < theadoff >通常太长而无法测量,通常大于7,000 s(图2c, 1),这与最近的单分子研究结果一致30。与之形成鲜明对比的是,S1_T1和S1_T2配合物仅在数百秒内就导致了端珠的损耗(图2f,i)。与使用S1_T0 SpCas9和S2_T0 SpCas9 RNPs相比,使用S1_T1和S1_T2 SpCas9诱导DSB的效率更高,这在一定程度上也违反了批量分析(图1b-d和扩展数据图9a),后者显示了相当水平的DSB。为了监测这一反应的效率,我们计算了从r环形成到明显DSB诱导的分子比例,方法是将2小时内出现的丢头事件数除以显示r环形成的分子总数。通过这一度量,S1_T1和S1_T2的丢头分数仍然明显高于S1_T0和S2_T0(扩展数据图9b)。在另一个位点(S5,见扩展数据图10a-i)进行的分析证实,典型的pam介导的催化后络合物比移位- pam变异更稳定。这些发现使我们预测SpCas9 RNPs被证实具有切割DNA(即那些观察到处于扭转放松状态的DNA),特别是典型的SpCas9复合物,导致相对较少的珠粒丢失,可能包含由SpCas9 RNP连接在一起的双链断裂。
为了检验这一点,我们利用了S2_T0和S3_T0 SpCas9靶向RNA聚合酶用于转录纳米操纵DNA的模板链的事实。我们推断,如果裂解后复合物的解离是通过典型的PAM处理靶标的限速步骤,那么RNA聚合酶的转录可能会导致与裂解后复合物的碰撞,从而促进其解离。事实上,转录RNAP几乎使丢失的小珠数增加了一倍(图3a-f和扩展数据图9a,b)。因此,我们提出,典型SpCas9靶向的低头损失率是由于切割后DNA-dgRNA-SpCas9复合物比移位- pam靶向的SpCas9相对更高的稳定性。
图3:带cano的目标DNA区域的末端头损失的观察和量化在没有或存在RNAP的情况下,典型的PAM间隔。
a,使用S2_T0 SpCas9与RNAP结合获得的典型DNA延伸时间轨迹。DNA最初被正向超旋五圈,以便在抑制反应的条件下将试剂注入样品室,之后DNA被反向解旋八圈(顺时针箭头),以允许一系列事件发生,包括r环形成、超旋圈损失(蓝色箭头)和终端头损失(根据扩展数据图7b)。终端磁珠损耗的力矩在时间轨迹上表示为顶部有向上箭头的磁珠。时间轨迹y轴被标记为使表面上方的最大头位置设置为零,并且较低的扩展被报告为负值。b,由形成r环的分子数归一化的丢包事件百分比(根据扩展数据图7b)显示双峰分布。c,d,与a和b一样,但对于S3_T0 SpCas9没有RNAP。在这个时间轨迹上没有观察到珠粒丢失。e,f,与c和d中一样,但对于S3_T0 SpCas9与RNAP。S2_T0 SpCas9 + RNAP、S3_T0 SpCas9和S3_T0 SpCas9 + RNAP在2小时内观察到的平均串珠损失率分别为56.5% (n=69)、22% (n=59)和52.4% (n=103)。所有持续时间超过10800秒的事件都被记录为10800秒。具体数值见补充表3。
源数据
同样,我们提出在应力SpCas9复合物中观察到的超线圈耗散速度比在非应力SpCas9复合物中观察到的更快,这是由于规范间隔的非应力SpCas9复合物相对较高的稳定性。为了探索这一假设,我们分析了未受应力和受应力的HNH-SpCas9和RuvC-SpCas9的超线圈损耗时间。
使用HNH-SpCas9获得的结果与使用野生型SpCas9获得的结果非常相似,pam移位导致形成r环所需的时间增加,观察超卷曲损失所需的时间减少(图4)。使用RuvC-SpCas9进行pam移位也导致形成r环所需的时间增加,观察超卷曲损失所需的时间减少,尽管有趣的是,在这种变异中,即使没有移位的PAM,也有很大一部分分子表现出超旋度的快速丧失(图5和补充表3)。野生型SpCas9和变体之间r -环形成速率的差异不应该被解释,因为它们可能仅仅归因于特定活性的差异,因为酶制剂不同。
图4:使用HNH-SpCas9 (D10A)进行dna缺口检测时r -环形成和超级线圈损失。
a-c,实验用S1_T0 HNH-SpCas9进行。a、磁头位置时间轨迹。洋红色的条形图突出了DNA被正超卷曲以注射RNPs的阶段;顺时针方向的箭头表示DNA负超螺旋开始反应的时刻;橙色条表示DNA负超卷曲的阶段。r环形成的力矩用青色垂直箭头表示,超线圈损耗的力矩用蓝色垂直箭头表示。时间轨迹y轴被标记为使表面上方的最大头位置设置为零,并且较低的扩展被报告为负值。b, r -环路形成的时间分布(由a中的青色箭头标记)适合于单一指数分布(红线),产生所示的平均寿命。c、r环形成和超线圈损耗之间的时间分布(用a中的蓝色箭头表示)也适合于单指数分布(红线),并表示平均寿命。随后的面板结构与a-c相同,但使用了不同的引导rna: s1 - t1 HNH-SpCas9 (d-f);S1_T2 HNH-SpCas9 (g-i);S2_T0 HNH-SpCas9 (j - 1)。对于S1_T1 HNH-SpCas9和S1_T2 HNH-SpCas9,第一模态,即快速解离的超线圈损耗事件,拟合为单指数分布(红线),其平均寿命(f,i)。所有持续时间超过3600秒的事件都被记录为3600秒。S1_T0 HNH-SpCas9、S1_T1 HNH-SpCas9、S1_T2 HNH-SpCas9和S2_T0 HNH-SpCas9保持超旋度> 3600 s的分子占比分别为81.4%、0%、28%和84.1%。具体数值见补充表3。
源数据
图5:使用RuvC-SpCas9-H840A进行dna缺口检测时r -环形成和超级线圈损失。
面板的结构如图4所示,但使用了RuvC-SpCas9。a-c,实验用S1_T0 RuvC-SpCas9进行。a、磁头位置时间轨迹。洋红色条突出了DNA正超旋的阶段,用于注射RNPs;顺时针方向的箭头表示DNA负超螺旋开始反应的时刻;橙色条表示DNA负超盘绕的阶段。r环形成的力矩用青色垂直箭头表示,超线圈损耗的力矩用蓝色垂直箭头表示。时间轨迹y轴被标记为使表面上方的最大头位置设置为零,并且较低的扩展被报告为负值。b, r -环路形成的时间分布(由a中的青色箭头标记)适合于单一指数分布(红线),产生指示的平均寿命。c、r环形成和超线圈损耗之间的时间分布(用a中的蓝色箭头表示)也适合于单指数分布(红线),并表示平均寿命。随后的面板结构与a-c相同,但使用了不同的引导rna: s1 - t1 RuvC-SpCas9 (d-f);S1_T2 RuvC-SpCas9 (g-i);和S2_T0 RuvC-SpCas9 (j - 1)。在S1_T0和S2_T0的时间轨迹中,r环形成(青色箭头)和超线圈损失(蓝色箭头)的步骤很容易区分,但发生的顺序更快,因此只能在S1_T1和S1_T2 RuvC-SpCas9催化事件的插图中解决。所有持续时间超过3600秒的事件都被记录为3600秒。S1_T0 RuvC-SpCas9、S1_T1 RuvC-SpCas9、S1_T2 RuvC-SpCas9和S2_T0 RuvC-SpCas9保持超旋度> 3600 s的分子占比分别为34.6%、16.4%、24.6%和26.2%。具体数值见补充表3。
源数据
使用野生型复合体的超级线圈损耗率及其随复合体移位而逐渐增加的情况,与使用RuvC-SpCas9复合体的超级线圈损耗率及其随突变复合体移位而逐渐增加的情况一致。通过移位HNH-SpCas9获得的超级线圈损失率的增加似乎并没有导致通过移位野生型复合物获得的超级线圈损失率的增加。然而,与未移位的HNH-SpCas9相比,移位的HNH-SpCas9的超级线圈损失率更高,这与该突变体在整体分析(使用SDS或热变性)中显示的实际可比切口效率形成了对比。这表明HNH-SpCas9即使在进行链切割后也有助于维持超卷曲,这可能是因为RNA“夹板”和RNP与下游PAM之间的接触,并且随着PAM间距的移动而使RNP复合物紧张,导致其迅速失去对切割但仍然超卷曲的DNA的控制。这与移动HNH-SpCas9轨道后发生的超螺旋释放速率增加的事实是一致的,而通过移动野生型SpCas9获得的头释放速率增加。这些结果表明,通过催化后络合物在r环本身水平上的构象畸变,不稳定和分解是整个加工反应的关键限速特征。
从
摘要。
主要
结果
讨论
方法
数据可用性
代码的可用性
参考文献。
致谢。
作者信息
道德声明
同行评审
扩展数据
补充信息
源数据
# # # # #
在这项研究中,我们描述了SpCas9介导的移位pam介导的DNA加工。我们提出,当NGG pam不是常规定位在rna引导的靶序列附近时,SpCas9保留了“挤压”亚策略的几个核苷酸的能力,通过对两条链的偏移切割实现双链DNA切割,并破坏切割后复合物的稳定性。与使用移位的pam形成r环的“压缩”假设相一致,我们比较了典型(S1_T0)和移位(S1_T2) SpCas9-DNA复合物产生的r环的大小,发现后者产生的r环比前者产生的r环大2 bp,正如预测的那样(图6a,b)33,34。
图6:DNA在移位- pam复合物中发生挤压,以及用cano催化靶序列的模型和移位的pam。
a,在与S1_T0或S1_T2 dSpCas9形成r -环的相同DNA分子上观察到的平均延伸变化的相关性,Δl。误差条表示S1_T0或S1_T2 RNPs形成r -环的DNA延伸变化直方图符合高斯分布,分别产生81±2 nm (s.e.m, n=26个事件)和94±3 nm (s.e.m, n=19个事件),对应于S1_T2 dspcas9 r -环的额外2 bp的解绕(见方法)。仅使用dSpCas9观察到的一小部分(15%)可能未成熟的r -环只有大约一半的完全解绕,被排除在分析之外。c-e,典型PAMs靶序列催化步骤模型。c, crRNA的前20 nt与互补链形成r环,PAM与SpCas9的PAM相互作用基序相互作用。d,互补链可以被HNH核酸酶切下(下),非互补链可以被RuvC核酸酶切下(上)。由HNH核酸酶切割互补链不有利于超螺旋(S.C.)的损失,因为RNA:DNA杂交体在切割部位起夹板的作用。相反,非互补链被RuvC结构域切开往往会导致超卷曲的损失。e,当两条链都被切割时,稳定的切割后复合体可以长时间地将断裂的DNA末端系住。f-h,具有移位PAMs的目标序列催化步骤模型。f,在移位PAM形成的预催化配合物中,机械应变减缓了r环的形成和PAM的结合。g,然而,机械应变也会导致配合物的不稳定,在切割时,HNH结构域(底部)和RuvC结构域(顶部)的超线圈的特征损失。h,一旦双链切割完成,张力的、不稳定的切割后复合体将断裂的DNA末端更弱地结合在一起,有利于DSB末端的分离。图形代码:DNA,蓝色;crRNA-tracrRNA双工,橙色;PAM、绿色;切割部位,剪刀;SpCas9,青色兔状;pam相互作用的图案,品红点。
源数据
通过大量分析和测序分析,我们发现移位的SpCas9复合物产生长达几个碱基的DNA悬垂。即使随着菌株的增加,互补链的HNH结构域切口也忠实地跟踪RNA-DNA杂合体的位置,当它离开PAM时,将切口保持在离杂合体5 '端17 nt处。同样,RuvC切口与PAM相邻,最多可移位2个碱基,从而在DNA末端产生最多2个碱基的3 '悬垂。然而,从3个碱基的移位开始,RuvC结构域切口从pam -邻域“滑移”到HNH-邻域,这可能突出了RuvC结构域和HNH结构域以及RuvC结构域和PID之间不同的相互作用。RuvC结构域仍然可以在“滑动”状态下切割非互补链,但这些切割事件面对HNH切口部位,再次导致钝性悬垂的形成。在人类细胞中,1 bp移位的PAMs导致强健的dsb;然而,2 bp移位的PAMs产生更弱的切割,可能是由于核小体结合和细胞中较少的负超卷曲基因组DNA。
单分子研究SpCas9及其核酸酶结构域突变体在规范和移位-PAM靶向背景下的r -环形成、DNA单链切割和DNA双链切割的动力学,使我们能够更深入地了解SpCas9的切割过程,以及抵消导链和PAM间距对催化前和催化后复合物的影响。这与早期的发现一致,即播种区域内的DNA泡可以容忍RNA-DNA不匹配11。综上所述,这些结果使我们提出了SpCas9作用的统一催化机制,该机制由PAM和r环之间的间距调节。对于标准间隔的pam(图6c - e), PID结合有助于稳定催化前络合物(图6c),然后是HNH结构域的互补链切割(图6d,底部)或RuvC结构域的非互补链切割(图6d,顶部),以随机方式进行。虽然HNH核酸酶在r环内的切口不会立即导致超级线圈的丢失,可能是因为RNA可以起到“夹板”的作用,但RuvC核酸酶在非互补链上的切口会导致超级线圈的快速丢失。一旦两条链都被切开,由于桥接断裂的复合物的整体稳定性,两个断裂的DNA末端保持系住(图6e)。在移位pam的情况下,在r环状态下引入了额外的机械应力,克服了夹板的稳定作用,导致超级线圈的快速损失,即使在hnh结构域切割和催化后复合物在两条链被切割后快速解离时也是如此(图6f-h)。
根据我们的模型,最近的研究已经确定,催化后络合物中的互补链比非互补链更稳定35,36。从单分子和大量实验中,我们得出结论,spcas9介导的DNA双链切割不一定会导致断裂端快速解离。超线圈效应在未移位的野生型Cas9中迅速消失,RuvC和HNH催化活性都参与了第一次切口事件。超线圈损耗率随移位而增大。在超过一半的事件中,未移位的SpCas9似乎无法被留在DNA断裂上的SpCas9检测到,很可能通过维持r环和参与切口后复合体的PID来桥接断裂。通过改变RNA-DNA杂化体和PAM之间的间距,复合物可以不稳定,导致移位复合物的终端头损失率更高。这种复合体也可以用转录RNA聚合酶从DNA上移除。移位的复合物因此导致DNA的分解增强,这似乎是DNA加工的关键限速步骤。
我们的工作补充并扩展了先前的研究,表明SpCas9对PAM-近端播种区引导dna错配的耐受性远低于PAM-远端非种子区13,SpCas9的PAM相互作用域的定向突变可能导致变异更倾向于非规范的PAM组合16,17,19。本文描述的shift-PAM靶向在设计sgrna时进一步扩展了选项,并且在各种基因组编辑环境中应用时将非常有用。
集合分析、新一代测序工具和单分子研究的结合,使我们能够解剖SpCas9作用于其靶DNA的步骤序列,从r -环形成到单链断裂诱导,到双链断裂形成,再到切口后复合物解离,使用标准和张力r -环- pam间隔。我们的研究结果表明,蛋白质- dna复合物具有足够的可变形性,足以容忍PAM和种子区之间距离的调节,并且这足以导致单个机械应力dgRNA-SpCas9产生悬垂末端并迅速解离。这为选择SpCas9靶标提供了额外的自由度,并在设计引导rna期间提供了一个额外的层来识别潜在的脱靶效应。
单分子分析表明,催化后复合物解离是分离DNA末端的限速步骤,而转移的PAMs加速了解离。为了直接观察SpCas9的动态变化,并确定SpCas9在末端分离后是否留在两端,还需要使用其他单分子工具,包括全内反射荧光显微镜和荧光共振能量转移。
SpCas9可以产生短的模板插入,可能涉及交错切割和5 '悬垂,但其分子机制尚不清楚24,37,38,39,40,41。结合LAM-HTGTS的活细胞裂解实验表明,典型PAM和1 bp移位的PAM都能产生相当的裂解频率,尽管较大的移位会显著降低裂解效率。因此,更有效的shift-PAM工程可能需要潜在地提高基因敲入效率。
从ATCC中获得HEK293T细胞,在37℃和5% CO2条件下,在添加10% (vol/vol) FCS、50 U mL-1青霉素-链霉素、2 mM l-谷氨酰胺、1× MEM-NEAA、1 mM丙酮酸钠、50 μM 2-巯基乙醇和20 mM HEPES (pH 7.4)的DMEM中培养。HEK293T细胞仅在转染前2 h和转染后6 h在2.5% FCS (vol/vol) DMEM培养基中维持。
用慢病毒携带多西环素诱导的SpCas9-T2A-GFP和BSD基因片段感染K562- icas9 - gfp细胞系。简单地说,通过替换lentii - icas9 - neo (Addgene no.)的NeoR来改造供体质粒。85400)42与BSD。将感染的K562细胞以0.3 cells well-1的浓度接种于96孔板中。10 d后取细胞集落,进行基因分型、荧光显微镜、流式细胞术和western blotting,选择稳定的K562-iCas9-GFP细胞系。K562-iCas9-GFP细胞保存在Roswell Park Memorial Institute (RPMI)-1640培养基中,培养基中添加10% (vol/vol) FCS、50 U mL-1青霉素-链霉素、2 mM l-谷氨酰胺、1× MEM-NEAA、1 mM丙酮酸钠、50 μM 2-巯基乙醇、20 mM HEPES (pH 7.4)和10 μg mL-1囊胚杀虫素;仅在需要表达Cas9时加入强力霉素1 μg mL-1。为了保存细胞系,实验中未使用强力霉素处理过的细胞。
crrna和tracRNA(见补充表4)在提供的缓冲液3.1 (NEB)中以1:1 - 1 μM与0.2 UμL-1 RNaseOUT (Invitrogen)混合,在90°C下变性2分钟,室温下冷却30分钟,使RNA双工dgRNA形成。将SpCas9及其突变体与dgRNA二聚体按1:1的比例加入,在室温下再孵育30分钟,使其形成稳定的RNP颗粒。
如前所述,大肠杆菌RNAP核心亚基和σ因子在全RNAP酶中表达、纯化和重组43。
目标DNA是一个约200 bp的转录本单元(如图1所示),插入到Charomid-9-5载体独特的Kpn1位点上。每个位点两侧约1 kb的靶DNA转录本通过PCR扩增得到2.2 kb的DNA插入片段,并被亚克隆到pUC18载体的SbfI和XbaI位点20。含2.2 kb DNA插入片段的pUC18及其sbfi线性化产物作为集合分析的底物。位点导向突变体通过配对PCR产生,并通过Sanger测序证实。
转化含有2.2 kb靶向DNA的pUC18质粒,用大肠杆菌Turbo (NEB)扩增,用NucleoBond midi-prep (Macherey Nagel)提取。用1%琼脂糖凝胶电泳进一步纯化质粒,并使用NucleoSpin试剂盒(Macherey Nagel)获得超螺旋双链环状质粒。用SbfI处理超螺旋质粒生成线性化的DNA底物,并使用1%琼脂糖凝胶电泳和凝胶提取试剂盒纯化。
将超螺旋质粒和线性化质粒与dgRNA-SpCas9或dgRNA-SpCas9突变体混合,最终浓度分别为10 nM(底物)和100 nM (RNPs),在10μL反应缓冲液(20 mM HEPES-K pH 7.8, 150 mM KCl, 5 mM MgCl2, 2 mM DTT, 0.5 mg mL-1 BSA, 0.05% Tween-20, 0.2 UμL - 1 RNaseOUT)中,在34°C下孵育。加入6倍负载染料(1% SDS)猝灭反应,在65℃下孵育3 min,然后使用ChemiDoc系统(Bio-Rad)进行1%琼脂糖-乙酯凝胶电泳检测裂解效率。
in - del实验中,将超螺旋质粒与dgRNA-SpCas9混合至终浓度为10 nM(底物)和100 nM (RNP),终体积为100 μL,在37℃下孵育过夜。然后加入6倍上样染料,65℃孵育3 min;然后用1%琼脂糖凝胶电泳,用DSBs纯化质粒。纯化的DNA分子用快速钝化试剂盒(NEB)处理,并按照相应的方案使用快速连接酶试剂盒(NEB)或T4-DNA连接酶(NEB)进行连接。将重新连接的质粒转化为Turbo感受态细胞(Turbo competent cells, NEB),在冰上孵育30分钟,在42°C热休克45秒,在冰上冷却2分钟,在37°C的SOC培养基中短暂恢复10分钟,最后用氨苄西林涂在LB琼脂上,在37°C孵育过夜。第二天,挑选单个菌落,扩增,质粒纯化用于桑格测序。
对于5 '定位试验,除了底物DNA分子在SpCas9切割后被sbfi线性化外,所有步骤与In-Del试验相同。dgRNA-SpCas9 RNPs裂解产物分别约为4 kb和1 kb,这4 kb的DNA分子进行了上述相同的钝化、重连接、转化和测序。因为DNA裂解产物的5 '端是固定的,所以5 '端是可以确定的。
in - del测定可用于在atgc -多样性微位点中核苷酸缺失或插入的情况下获得单核苷酸分辨率(补充表2中的S4_T2);然而,在完全修复为主的情况下(S2_T0, S1_T0, S1_T4和S1_T-1见补充表2),或者在一个核苷酸连续相同的微位点上插入或删除核苷酸的情况下(S1_T1, S1_T2, S1_T3和S5_2见补充表2),它不能用于确定精确的切割位点。因此,需要5 '定位试验来排除其他切割可能性并确定切割位点。
HEK293T细胞以30%的合度在6孔板中分裂,在含10% FCS的DMEM培养基中培养。16 h后,换为含2.5% FCS的低血清培养基DMEM,维持1-2 h。同时制备了PEI(聚乙烯亚胺)混合质粒。简单地说,将15μL PEI (1 mg mL-1)加入到110μL NaCl (150 mM)中,形成PEI工作溶液,并将携带RAG1B_T0、RAG1C_T0和RAG1D_T0三种t0 - sgrna的pX330质粒(每个约1 μgμL - 1)与饵料-L或饵料- a按1:1:1:2的比例混合(饵料-L为5 μg:5 μg:5 μg:10 μg;饵料a加入4 μg:4 μg:4 μg:4 μg:8 μg)和NaCl (150 mM),最终体积为125μL,形成DNA工作液。将PEI工作液一滴一滴加入DNA工作液中,混合均匀后,在RT下孵育20 min,均匀分布到HEK293T细胞培养中。制备T1 sgRNA、T2 sgRNA和单独对照的PEI质粒混合物,并将其分配到HEK293T细胞培养中。6 h后,将低血清培养基替换为含有10% FCS的生长培养基DMEM。3 d后,收集HEK293T细胞并裂解,提取基因组DNA。以RAG1D_T0为诱饵(6 μg),对猎物rag1k - rag10(各3 μg)进行同样的实验。
对于LAM-HTGTS,每个处理条件下的50个μg基因组DNA在一个文库中制备,具有独特的条形码,如前所述22。简而言之,基因组DNA通过超声剪切形成200 bp至2 kb之间的片段;然后使用生物素标记的引物靠近诱饵部位进行LAM-PCR。LAM-PCR的产物附着在链霉亲和素磁珠上,并进行适配器连接。连接的产物进一步进行巢式PCR,使用一个与适配器匹配的引物(AP2I7)和另一个与诱饵位点和生物素标记引物之间的区域匹配的引物(带有几个核苷酸条形码的巢式引物)。随后使用与巢式PCR中使用的引物相匹配的引物P7I7和P5I5进行标记PCR。用1%琼脂糖凝胶纯化标记PCR的产物,范围在500 bp到1 kb之间,并进行质量控制和NovaSeq (Novogene)。寡核苷酸序列见补充表6。
转染3 d后收集HEK293T对照细胞和转染不同诱饵和猎物引导rna组合的细胞。500万个细胞被溶解。指示抗体(anti-Flag, 1:20 00, 12793S, Cell Signaling Technology;抗兔igg, 1:20 00, G-21234, Thermo Scientific;western blotting实验采用anti-β-actin, 1:4 000, SC-47778, Santa Cruz Biotechnology)和辣根过氧化物酶(HRP)底物(K-12042-D10, Advansta)。
将sgRNAs基因GFP_T0、GFP_T1、GFP_T2和RAG1L_T0克隆到pMCB320质粒(Addgene no.89356)44中。然后,将GFP_T0-、GFP_T1-、GFP_T2-、RAG1L_T0-pMCB320质粒分别5 μg通过4D-nucleofector (Lonza)传递到K562-iCas9-GFP细胞中。转导后的细胞在含有10% FCS、0.2 mg mL-1 G418、5 μg mL-1囊胚灭精和1 μg mL-1强力霉素的RPMI培养基中回收。在pMCB320质粒中使用mCherry,流式细胞术(BD)检测到,在所有条件下,转染2天后的转染效率为~60%。转染后第7天用流式细胞术检测GFP敲除效率。
将2.2 kb的DNA通过T4 DNA连接酶(NEB)通过SbfI和XbaI悬垂与1kb生物素和dig标记的DNA连接。将结扎的产物附着在反应室的抗挖掘表面和链霉亲和素涂覆的磁珠上。附着的DNA构建物是用于单分子分析的底物。每种SpCas9组分,包括单独的dgRNA、dgRNA - SpCas9和dgRNA - SpCas9突变体,均以1 nM的浓度存在。在转录增强裂解实验中,还引入了200 pM RNAP和100 μM ntp。
在0.2 pN下取DNA帽曲线,根据生物物理性质(包括DNA的弹性和延伸性)区分完整的双链DNA、缺口DNA和缠结DNA 27。在接下来的单分子实验中,我们只使用完整的双链DNA分子。然后以0.2 pN的延伸力重新校准完整的双链DNA分子的延伸,进行8圈负超卷、不超卷和5圈正超卷,以重复检查初始校准并生成DNA延伸参考。随后,将作用力增加到1 pN (DNA分子保持5圈正超旋),并在每次实验中将包括单独dgRNA、dgRNA - spcas9或dgRNA - spcas9突变体的样品引入反应室。样品注入的流动引起了一个波动峰。当反应体系稳定后,作用力降至0.2 pN。将DNA分子分别置于5圈正超圈和8圈负超圈下,观察r环的形成、超圈的损耗和磁珠的损耗。
利用ImageJ定量测定etbr -琼脂糖凝胶中DSBs和SSBs的裂解效率,并通过减去对照背景进行归一化。进一步分析了效率,并使用GraphPad绘制了图表。
使用PicoJAI软件套件(PicoTwist SARL)处理单分子数据。
时序分析
r环形成或解离所需的时间,从r环状态过渡到扭转放松状态(失去超线圈)所需的时间,以及从扭转放松状态过渡到磁珠不可逆损失所需的时间,通过分析DNA延伸与在单个DNA分子上获得的时间痕迹,在单个分子事件水平上表征。通过将时间分布拟合到单指数衰减,得到了催化前后配合物中相应状态的平均停留时间。用Python和GraphPad比较不同处理的显著性水平。
空间分析
在r环形成和解离过程中,DNA延伸的纳米尺度变化通过分析单个DNA分子上获得的DNA延伸与时间轨迹,在单个分子事件水平上进行表征,然后通过连接数形式将DNA卷曲的变化转化为DNA解绕的变化,从而转化为碱基对中的DNA解绕,如前所述32,33。使用DNA延伸的校准变化(在我们的力和盐度实验条件下,通常每单位扭动约55 nm,见扩展数据图7a)和DNA间距10.5 bp turn-1。因此,例如,由于每个crRNA的播种序列为20纳米,理论上完全杂交的RNA-DNA(成熟的r -环)解绕大约两圈DNA,导致DNA中增加了两个单位的正旋,同时负旋DNA的延伸增加了约110纳米。单链DNA切开后,DNA分子有可能达到扭转松弛状态(完全失去超卷曲,对应于扩展数据图7a中所示的最大延伸状态),而在两条链被切割后,DNA分子有可能断裂,如磁珠的不可逆损失所示。
LAM-HTGTS数据分析按先前报道进行22。简而言之,illumina reads被解复用,适配器序列分别使用ea-utils和SeqPrep工具的fastq- multix工具进行裁剪。用Seqtk将Reads归一化,并使用TranslocWrapper将易位映射到hg19参考基因组。使用HTGTS Rep将Reads与诱饵区对齐以识别重连接事件,然后使用Rejoin将其与易位相结合。去除易位的重复以消除PCR的人工重复,具有准确的诱饵序列和准确的猎物序列的特点,可能并不完美,因为其中一些可能是真正的生物重复。
有关研究设计的更多信息可在本文链接的自然组合报告摘要中获得。
ccDownload: /内容/ pdf / 10.1038 / s41594 - 023 - 01104 - 6. - pdf
相关文章
发表评论