植物基因替换编辑技术研究进展

植物基因替换编辑技术研究进展

2018-05-29 15:28:45 101

植物基因替换编辑技术研究进展

摘 要: 基因替换编辑是通过核酸酶介导的对目标基因进行定点敲入或替换的编辑技术,可以实现目的基因的定向修饰。本文从基因替换编辑技术的原理、实现方式与影响因素、应用及其前景等进行了总结与讨论,以期为通过定点基因替换或敲入技术开展高等植物基因功能鉴定与遗传改良研究提供参考。

基因 (组) 编辑是指通过人工构建工程化的核酸酶,对基因组目标区间序列特异性识别与 切割,定点切割产生双链断裂 (Double-stranded break,DSB),并通过细胞内源的同源重组或非同源末端连接DNA损伤修复机制,对受体物种基因或基因组引入目标基因敲除、缺失、插入、替换、修饰或染色体易位与重排等定向突变的技术。在生命科学领域,基因组编辑技术最重要的生物学意义是可以实现定点定向突变,即按照人类的设想精确设计想要的基因型。

因此,该技术在生物基础科学研究、医学、工业微生物、作物遗传改良等广泛领域具备重大的理论与实践应用研究价值。基因编辑技术体系根据其定点核酸酶技术原理,可分为归巢核酸酶技术 (Meganucleases)、锌指核酸酶 (Zinc finger nuclease, ZFN)、类转录因子效应物核酸酶 (Transcription activator-like effector nuclease,TALEN),以及成簇规律间隔短回文重复序列 (Clustered regularly interspaced short palindromic repeats, CRISPR) CRISPR/Cas 系统基因编辑技术。近年来,CRISPR/Cas 系统基因编辑技术发展突飞猛进,由于其设计简便、系统简单易行、定点突变效率高等优点,正在成为基础与应用研究重要的基础工具。然而,基因替换尤其是大片段 DNA替换编辑仍存在突变效率低与精确性差等技术限制。本文主要综述了植物基因替换编辑研究进展。 
 
1、基因替换编辑技术及其意义

通过基因编辑产生的突变根据突变基因的功能又可分为无义突变和有义突变。无义突变主要有碱基插入或缺失移码而导致的基因敲除、基因删除和倒位突变体。有义突变主要有基因的替换、基因修饰以及定点插入。最近报道实现的基因组的单碱基编辑可实现单碱基替换,该技术实质上通过基因定点单碱基修饰。

本文所讨论的基因替换是指可实现目标区域较长 DNA 区段精确定向突变的技术,可引入任意人为目标突变,使 DNA 精确地整合到基因组中所需的位置,并稳定表达。例如,Susan M Byrne 等通过 CRISPR/Cas9 技术对人体多功能 干细胞进行替换研究,成功用老鼠的同源序列部分替换了人的相应序列。与其他突变相比,任何DNA序列的突变都可以通过较大片段的基因 (DNA) 替换来实现。因此,基因替换编辑技术具备真正意义上的定向突变能力,在农作物遗传改良与基因功能鉴定基础研究中具有重大的理论价值与实际应用意义。

2、基因替换编辑主要技术构成与步骤

基因替换编辑技术包括核酸酶剪切模块和模板修复模块两个部分,核酸酶剪切单一位点或 多个位点可由 ZFNs、TALENs 和 CRISPR-Cas9 完成,修复模板分为 DNA 双链或寡核苷酸链。基于同源重组 (Homologous directed recombination, HDR) 修复途径的 DNA 双链修复模板同源臂长度从数百bp至几kb不等,寡核苷酸链修复模板同源臂约 60 nt,核酸酶识别位点位于同源臂两端;基于非同源末端连接 (Non-homologous end joining,NHEJ) 途径的修复模板无同源臂, 核酸酶识别位点位于模板两端。

基因替换编辑技术的步骤主要包括剪切和修复两个过程,受体基因组目标位点被核酸酶识别剪切,产生 DNA 双链断裂,修复模板基于同源重组修复 (HDR) 或非同源末端连接 (NHEJ) 途径进行替换,HDR 相对于 NHEJ 修复途径更为精确,但由于细胞周期中 HDR 活性存在时间短,效率低于 NHEJ。

3、基因替换编辑技术分类

在基因替换编辑中,依据目标基因替换的类型,可分为基因替换、启动子等调控因子替换以及基因敲入。依赖内源 DNA可分为通过细胞内源的 HDR 或 NHEJ DNA 损伤修复机制,可通过这两种机制引入基因替换或插入突变。

3.1 依赖 HDR 修复途径的基因替换编辑

对所有真核生物来说,利用基因替换方法准确地将新的等位基因引入基因组具有一定的挑战性。虽然使用CRISPR/Cas9的基因敲除在许多植物中得到应用,但是迄今为止仅有少数基于 CRISPR/Cas9 的基因敲入或替换的报道。为了使用 CRISPR/Cas9实现基因敲入,必须使用 DNA 模板作为修复供体序列,通过HDR 修复双链断裂,替换到指定的区域。HDR 是一种精确的修复方式,它可以保证细胞基因组的完整性,在DNA修复中起着举足轻重的作用。 HDR 途径活性一般发生在细胞有丝分裂的 S 期 到 G2 期,但修复精确度高。其诱导产生的突变大部分为同源供体DNA介导的大片段的插入或核苷酸修正。

CRISPR/Cas9 介导的定点诱变和敲除已被用于水稻和拟南芥原生质体。最近,该技术也成功地用于在水稻中替换了两个乙酰乳酸合酶基因,从而赋予水稻对除草剂双草醚的抗性。虽然已经有一些成功的案例,但在植物中普遍进行基因敲入和替代的策略仍然具有挑战性。

HDR 相结合的 CRISPR/Cas9 剪切有可能克服这一挑战。在哺乳动物细胞中,研究人员已经通过用 Cas9/sgRNA 复合物靶向基因的同时用化合物Scr7抑制DNA连接酶Ⅵ和/或抑制 NHEJ 所需的基因(即编码 ku70 和 ku80 的基因),通过同源重组的基因替换效率显著增强。这种实验设计显著抑制了 NHEJ DNA 修复活性,并刺激 Cas9-/sgRNA 诱导的 DNA 断裂位点的同源重组效率提高。实际上,使用ZFN介导的基因靶向的报告显示,在涉及 NHEJ 修复的 smc6b 和 ku70 或 lig4 中,突变拟南芥中的基因编辑和同源重组增加。最近,在玉米和大豆中证明了同源重组的有效基因替换。使用双链或单链 DNA 分子作为替代链,通过启动转入未成熟玉米胚胎的 Cas9 和 sgRNA 基因实现了 5 个不同 靶基因的等位基因编辑。

通过 CRISPR/Cas9 剪切,同源重组率可以通过增加供体DNA的拷贝数,提高大约一个数量级。在近期的一项研究中,核酸酶构建体可以对改良大豆黄矮病毒基因组进行编码,该病 毒能在植物细胞内进行复制。模板同样在该复制子上编码,其侧翼是靶基因切割位点侧翼 DNA 的同源序列。将该复制子序列通过农杆菌T-DNA 转入番茄细胞。此外,预计会导致滚环式复制,并产生数百到数千个复制。使用该复制子观察到的基因靶向效率约为 10%,比所观察到的非复制型 T-DNA 载体序列增加一个数量级。该研究结合了同一实验室之前的研究结果,证明修复序列的高拷贝数与位点特异性 DNA 切割有效地通过同源修复过程促进基因靶向。

3.2 依赖 NHEJ 修复途径的基因替换编辑

NHEJ 修复是细胞的主要修复方式。当细胞内形成双链断裂时,DSBs 处被一些末端结合因 子蛋白结合,防止 DSBs 被核酸酶降解。随后,DSBs由于这些蛋白的相互作用使裂口处的 DNA 双链相互靠近,DNA 链就通过连接酶的作用连接从而修复断裂的 DNA 双链。NHEJ 途径活性高且持续整个细胞分裂周期并倾向差错修复 (Error prone repair)。其产生的突变大部 分为少量核苷酸的插入或删除。由于NHEJ修复中DSBs的修复没有模板,所以发生的概率要高于 HDR 途径所介导的基因替换。但由于其不依赖同源序列重组,对修复重连的 DNA 没有选择性,会导致引入错误的修复,精确性较差。

除了通过 HDR的遗传整合,也可以用 NHEJ完成靶向基因的插入或替换。在这种情况下, 不包含侧翼同源性臂的线性供体分子在被 NHEJ 修复期间在DSB被捕获。这种方法经常用于哺乳动物细胞中,但在植物中的使用鲜有报道。随着DSBs捕获外源 DNA效率的进一步提高,该方法成为将靶 DNA 整合到植物基因组中的潜在有效方法。高彩霞研究员与李家洋研究员利用 CRISPR/Cas9 技术基于 NHEJ 修复方式在内含子区域非同源末端连接修复机制,通过使用靶向相邻内含子的一对 sgRNA 和包含一对相同 sgRNA 位点的供体 DNA 模板,已经实现了频率为 2.0%的内源性水稻基因 5-烯醇式丙酮酰莽草酸-3-磷酸合酶 (EPSPS) 的基因替换,同时通过基因编辑技术实现了目标基因 2.2%的基因插入,并成功培育出具有抗除草剂水稻。这些新开发的方法通常可用于在水稻和其他植物中插入或替换靶基因片段。

4、影响基因替换编辑效率的因素

基因替换编辑技术中,靶向定点DNA的核酸酶、转化策略、DNA修复供体模板以及内源性 DNA损伤修复途径等是影响基因替换效率的重要因素。DNA 修复模板可以通过基因枪轰击的方法提供。Svitashev 等对授粉后 8–10d的未成熟玉米胚胎用基因枪进行轰击,与对照相比, Cas9-gRNA 处理的胚胎产生高频率的突变,大多数测试的gRNA产生突变频率大于 1.3%。通过基因枪轰击,提供的修复模板拷贝数明显增多,但同时也会存在一些缺点,如片段可能不完整、可能引起染色体重排、或受体基因组小片段外源 DNA 污染等。

DNA修复模板还可以通过稳定转化提供。 稳定转化的优点是供体来自稳定的系统,其中目标生物体中的DNA模板可以更完整,并且替代物的残余序列可以在后代的回交期间通过同源重组进行精确追踪和排除,从而产生“无转基因”个体。本小组通过稳定转化提供的DNA修复模板获得0.8%的频率,这对于大多数植物研究来说是令人满意的。使用 CRISPR/Cas9 和 DNA供体的稳定转化策略也在拟南芥中应用于产生靶向突变。

修复模板的提供对基因替换编辑效率有很大影响。可以通过优化供体DNA模板 (数量、长度、类型、导入方式等) 提高 HDR 介导的定点插入或替换效率。Baltes 等在烟草中利用双生病毒 (Geminivirus) 载体表达序列特异核酸酶 (Sequence-specific nucleases,SSNs) 和 DNA 模板,通过提高 SSNs 和 DNA 模板数量,提高了同源重组效率。Čermák 等在番茄中利用双生病毒复制子提高模板 DNA 含量,与传统的 DNA 传送方法相比,编辑位点的整合效率提高了10倍。

也有研究人员通过优化 DNA 模板同源臂 的长度来提高同源重组效率。双链 DNA 模板的 同源臂长度一般为 1–4 kb,即在 DSB 两侧等分成大约 0.5–2 kb。Byrne 等使用小鼠对应物替代内源性人类基因的系统模型进行了同源重组靶向载体设计参数的综合研究,高达 11%的人诱导多能干细胞都实现了 2.7 kb 纯合基因替换效率。研究发现同源长度在不与切割部位相邻的臂上特别重要,而基因替换最佳同源臂长度约为2 kb。切割位点内的同源序列对靶向效率是不利的。而 Shin 等利用 TALEN 技术建立了 GFP 报告系统,用于检测活斑马鱼胚胎中HDR事件的发生频率。通过共同注射具有不同大小同源臂的 TALE 核酸酶和 GFP 报告子靶向构建载体,发现较长的同源臂和线性化的供体 DNA 载体更有利于同源重组,同时还发现,在较短的一侧同源臂的内部切断供体DNA载体获得的同源重组效率最高,定点插入的传代效率能达到10%以上。

基因定点插入通常以双链环状载体或双链线性DNA作为供体DNA,此外,还可以使用单链寡核苷酸 DNA (ssDNA),其设计与合成比构建双链 DNA 载体更简便。研究发现, 单链或双链 DNA 模板对同源重组均有效。Li等利用靶位点两端各 1 kb 的同源臂,将外源潮霉素磷酸转移酶的基因片段同源重组整合到大豆基因组中,得到具有潮霉素抗性的大豆植株。另外,较短基因序列的精确修饰可以采用单链寡核苷酸DNA作为模板,同源臂的长度甚至可以仅为40nt,即两侧各有20 nt。Puchta实验室建立了一种高效的基因靶向 (Gene targeting,GT) 系统来提高同源重组效率,首先在植物基因组上稳定整合 SSNs 及供体 DNA 模板,SSNs 表达后同时切开基因组靶位点及供体DNA两侧的识别位点,释放线性供体 DNA,发生HDR修复。传统基因打靶实验中DNA模板由T-DNA载体提供,而植物体内基因打靶在所有细胞及植物发育周期中都能发生,因此HDR发生频率可能更高。

此外,NHEJ 和 HDR 两个途径也会对基因 替换编辑效率产生影响。与 NHEJ 途径相比, 依赖 HDR 途径修复的基因编辑效率较低。例如, 本小组实现的 HDR 基因替换编辑的频率为 0.8%[33]。但在精确度方面,HDR 要优于 NHEJ 途径。尽管 NHEJ 相对于 HDR 容易出错,基因 片段可能被反向插入或在 DSBs 连接处产生核 苷酸的插入或缺失,但 NHEJ 的效率要远高于 HDR,因此在精确度要求不高的情况下,可以 选择 NHEJ 途径开发目标基因替换的工具。

5、植物基因替换编辑应用

5.1 基于基因替换的遗传改良与育种应用

在玉米中,Svitashev 等利用单链寡核苷酸或双链DNA载体作为修复模板编辑 ALS2 基因,通过HDR途径将靶基因插入到目标基因座, 得到氯磺隆抗性植株。Townsend等利用ZFN技术,通过HDR途径分别定点替换烟草乙酰乳酸合成酶基因 (SuRA、SuRB) 的 3 个关键核苷酸位点,得到抗除草剂烟草,基因打靶效率在 0.2%–4%之间。基于 CRISPR/Cas9 系统,Sun 等通过 CRISPR/Cas9 系统介导的同源重组,对水稻 ALS 基因的两个氨基酸位点的密码子进行定点替换,通过后代分离,获得不含有转基因元件的抗除草剂水稻。

5.2 基于基因替换报告系统在基因功能鉴定上的应用

基因表达的组织与细胞定位是基因功能鉴定分析的重要内容,传统方法是把报告基因构建到推定的调控元件序列下游通过体外试验鉴定该基因的表达部位。由于是体外试验,不能完全模拟原目标基因上下游基因组序列及组织、器官与个体等不同发育水平的背景,结果并不可靠。基于 DNA 序列替换的定点敲入技术可把报告基因敲入目标位置,从而可以实现通过报告基因在活体细胞、不同发育阶段跟踪该基因的表达特征,获得准确与完整的基因功能鉴定。Voytas实验室通过在烟草原生质体中整合功能缺失的 gus:nptII 报告基因来检测同源重组率,该基因上含有ZFN (Zif268) 识别序列, 再将ZFN和供体 DNA 转入含有 gus:nptII 基因 的烟草原生质体中,成功完成替换。Zhang 等在烟草原生质体中转化 TALEN 和供体 DNA, 高达 14%的烟草原生质体细胞 ALS 基因位点整合了YFP报告基因,能够通过流式细胞术定量 TALEN 活性。Wang 等在小麦原生质体细胞中通过 NHEJ 途径介导不含启动子的 GFP 报告基因插入 TaMLO 基因位点,并通过流式细胞仪检测到 6.5%细胞有 GFP 表达,测序结果证明 GFP 按照正确读码框整合在 MLO 位点。 Fauser 等在拟南芥中利用 DGU.US 和 IU.GUS 两个GUS报告基因系统,证明 Cas9 核酸酶和 Cas9 切口酶都能有效诱导 HDR,且 Cas9 切口酶效率更高。

5.3 基于定点敲入替换技术的定点转基因技术及其应用

将外源 DNA引入植物基因组中预定的位置可为植物基因功能的研究提供有力的工具,并促进作物新品种的发展。基于定点敲入替换技术的定点转基因技术首先在动物中得到应用。Kamanaka 等设计了 GFP 敲入靶向载体,通过同源重组将GFP 整合到小鼠体内细胞产生的白细胞介素-10 (IL-10) 基因座并对其进行分析。 在植物中,Shukla 等通过 ZFN 介导的基因打靶在玉米中实现了基因的定点插入,使内源基因插入失活,基因替换效率达到10%以上,并可以稳定遗传。Cai等将靶向烟草几丁质基因的 ZFNs 转化烟草,并共转两端含有与靶基因同源的除草剂抗性标记,成功获得约10%定点插入抗性标记的转化细胞。当前的作物商业转化事件均需要从大量随机受体基因组整合的遗传转化事件中筛选优良农艺表现型的事件进入应用,费时费力,定点转基因技术可以在受体基因组染色质活性区域定点转入目标基因,可以有效提高研发与应用效率,因此也具备重要的应用价值。

6、讨论与展望

基因替换编辑通过核酸酶编辑技术以供体基因取代受体基因,可以实现 DNA 的定点替换 与插入,可以对任何需要的目的 DNA 序列进行修饰。在农作物遗传改良与基因功能鉴定基础研究中具有重大的理论价值与实际应用意义。

基因替换的要素包括目标 DNA 核酸酶、替 换修复模板以及内源 DNA 损伤修复。修复模板基于HDR或NHEJ途径进行替换,HDR 相对于 NHEJ 修复途径更为精确,而在修复周期上会短于 NHEJ。由于向植物细胞导入同源重组供体片段和 DNA 同源重组的效率较低,对目标基因进行碱基替换、片段替换和定点插入等精准编辑的效率低成为该技术的重大限制因素。因此,对于基因替换编辑来说,如何提高效率的同时保证编辑的精确性成为当前迫切需要解决的关键科学技术问题。

现有的实验证据表明,可以通过优化供体 DNA 模板,如增加供体 DNA 的拷贝数、优化 DNA 模板同源臂的长度、改变供体模板的类型及导入方式等,使同源重组效率提高。另 一方面,也可以通过改变修复途径来提高基因替换编辑效率。比如通过 CRISPR/Cas9 复合物靶向基因的同时,利用化合物抑制DNA 连接酶和/或抑制NHEJ所需的基因,来抑制NHEJ DNA 修复过程,并刺激 CRISPR/Cas9 诱导的DNA断裂位点的同源重组效率提高。与HDR修复 一般发生在有丝分裂 S 期到 G2 期相比,NHEJ 修复在全细胞周期都具有较高活性,也可通过 NHEJ 完成靶向基因的插入或替换。高彩霞课题组运用NHEJ在水稻中实现了频率为 2.0%的内源性水稻基因替换,并成功培育出具有抗药性的水稻。此外,基因替换编辑效率可以从合适的转化策略及对启动子进行优化等方面来提高。本小组通过稳定转化提供的DNA修复模板获得 0.8%的频率。

CRISPR/Cpf1 技术的出现为基于NHEJ修复方式的基因替换提供了新的方向。 CRISPR/Cpf1 技术裂解 DNA 后会产生 4–5 nt 的 粘性末端,根据受体产生的缺口,设计产生与其相互补的供体靶位点,在内源 DNA 连接酶的作用下拼接,相对于平末端会更加精确。这一特点已被应用于微生物载体的构建,并取得了显著的效果。相比于CRISPR/Cas9技术, CRISPR/Cpf1 技术因其粘性末端的特点会有更大的潜力。

植物中基于CRISPR/Cas9系统的同源重组效率较低,很难以此实现高效、稳定的单碱基突变。因此,植物育种和基因功能研究迫切需要新技术来提高基因组单碱基定点突变的效率,以实现基因功能与农艺性状的定向改良。目前较多的是在动物中的研究,Komor 等报道了一种新的基因组编辑方法,可以以可编程的方式直接且不可逆地将一个目标DNA碱基替换为另一种碱基,而不需要 dsDNA 主链切割或供体模板。他们设计了 CRISPR/Cas9 的融合体, 在人和小鼠细胞中,在大约 5 个核苷酸的窗口内转化胞质碱,介导胞苷到尿苷的直接转化, 从而产生 C→T (或 G→A) 的替代。Kim等设计了含有突变的胞苷脱氨酶结构域的基因编辑,将编辑窗口的宽度从约5个核苷酸缩小到 1–2 个核苷酸,从而能够区分相邻的C核苷酸, 而且可以使疾病相关的靶标Cs的数目加倍,并优先于邻近的非目标Cs进行校正。高彩霞研究组借鉴哺乳动物单碱基编辑方法,利用Cas9变体 (nCas9-D10A) 融合大鼠胞嘧啶脱氨酶 (rAPOBEC1) 和尿嘧啶糖基化酶抑制剂 (UGI), 成功地在小麦、水稻和玉米基因组中实现高效、 精确的单碱基定点突变,并获得了突变效率最高可达 43.48%的突变植株。单碱基编辑系统成功建立和应用,为高效和大规模创制单碱基突变体提供了一个可靠方案,为作物遗传改良和新品种培育提供了重要的技术支撑。

从长远来看,基因组编辑技术能使人们对植物基因组特定基因 (位点) 进行精准、高效的改造,这将对植物功能基因组研究和作物遗传改良产生巨大的推进作用,并对未来农业日益增长的需求提供可靠的保障。

来源:《生物工程学报》October 25, 2017, 33(10): 1723−1732

文章作者:王虹麟,张从省,刘昌林,谢传晓

作者单位:中国农业科学院作物科学研究所,安徽农业大学生命科学学院,中国农业科学院作物科学研究所作物分子育种国家工程实验室