仅用于克隆的载体如pBR322,其上含有表达元件吗?若不含表达元件,其上的选择标记如何表达?

  • 把目的基因导入到受体细胞中的工具叫做基因工程载体。

基因工程载体包括克隆载体和表达载体两大类。

  • 克隆载体包括:质粒载体、噬菌体载体、黏粒载体和人工染色体载体。
  • 表达载体包括:原核表达载体、酵母表达载体和哺乳动物细胞表达载体。

基因工程的目的就是把一个外源基因导入到受体细胞中并在受体细胞中内扩增、繁殖、表达并不断稳定的遗传下去。

首先目的基因不能单独进入受体细胞:

  • 第一,裸露的DNA一般进入不了细胞,因为细胞一般具有保护屏障,如细胞膜细胞壁等防护细胞免受外来物的侵袭。
  • 第二,即使DNA进入细胞,细胞的DNA酶和防御系统一定会把外来入侵的DNA切断。
  • 第三,加入没有被酶解切断,由于缺乏复制所需的完整复制子,DNA不能随着细胞遗传,不能稳定遗传,所以需要运载工具的帮助。

载体(vector):基因工程操作中,把外源DNA导入到宿主细胞(host cell)进行扩增表达的工具称为基因表达载体,vector。


基因的克隆载体必须具备以下条件:

  • 具备复制起点和完整的复制子结构,在宿主细胞中能够独立自主复制。
  • 有一个或多个用于筛选的标记基因,易于识别和筛选阳性克隆,如对抗生素的抗性,或含有某些基因产物的显色反应。
  • 具备合适的限制性核酸内切酶的单一识别位点(多克隆位点),便于外源基因的插入,同时不影响复制。

多克隆位点(multiple cloning site,MCS):是指载体上一段短的DNA序列,便于外源DNA片段的插入,同时不影响其复制。

  • 较高的拷贝数,便于目的基因的大量制备。

另外,具有较大的外源DNA的容量,同时不影响自身复制,也是载体发展的方向。

克隆载体包括质粒载体、噬菌体载体、人工构建的载体,如黏粒和人工微小染色体等。

质粒是指一类来源于细菌细胞染色体外的小的环状DNA分子,存在于某些细菌细胞内,并不是细菌生长和生存必不可少的结构,但是质粒的存在能够帮助细菌适应更广泛的环境,更好的生长,因为质粒上存在一些用于细菌生长的基因。

大肠杆菌的天然质粒:Col质粒(大肠杆菌素质粒,如ColE1)、R质粒(抗药性质粒)、F质粒(致育性质粒F因子)。

质粒DNA可分为三种类型:超螺旋SC结构(scDNA)、开环式DNA(ocDNA)、线性L构型。

质粒命名:小写p开头 ,p在这里指代质粒(plasmid),所以我们常常看到pXXXXX-XXXX

(1)质粒具有自主复制能力

通常一个质粒含有一个起始复制位点和相关的顺式调控元件。

在大肠杆菌中使用的大多数质粒载体都带有一个来源于 pMB1质粒或ColEl质粒的复制子结构,其复制方式见图3.3。在复制时,首先合成前引物RNAⅡ,它会与 DNA形成杂交体。而后RNase H切割前RNA Ⅱ,使之成为成熟的RNA Ⅱ,并形成三叶草型二级结构,引导质粒的复制。另一个片段 RNA I可控制RNA Ⅱ形成二级结构,而调控序列Rop具有增强RNA I的作用,从而控制质粒的拷贝数。削弱RNA Ⅰ和 RNAⅡ之间相互作用的突变,将增加带有pMB1 或ColEl复制子的拷贝数。

 (2)质粒的拷贝数

质粒可分为:严谨型质粒(1~10个)和松弛型质粒(多达几百个)。

pBR322质粒的复制子来自pMB1质粒,是严谨型复制子。pUC系列质粒的复制子则来自pMB1突变的复制子,其拷贝数较高,是松弛型质粒。

两个质粒在同一宿主中不能共存的现象称为质粒的不相容性(incompatibility),它是指在第二个质粒导人后,在不涉及DNA限制系统时出现的现象。

不相容的质粒一般都利用同一复制系统,从而导致不能共存于同一宿主中。有相同复制起始区的不同质粒不能共存于同一宿主细胞中,其分子基础主要是由于它们在复制功能之间的相互干扰造成的:两个不相容性质粒在同一个细胞中复制时,在分配到子细胞的过程中会竞争,随机挑选,微小的差异最终被放大,从而导致在子细胞中只含有其中--种质粒。而不相容群指那些具有不相容性的质粒组成的一个群体,- -般具有相同的复制子。在大肠杆菌中现已发现30多个不相容群,如ColE1(或pMB1)、pSC101和p15A分别是不同的不相容群中的质粒。

质粒具有可转移性,能在细菌之间转移。转移性质粒能通过接合作用从-一个细胞转移到

质粒的这种移动特性,与质粒本身有关,也取决于宿主菌的基因型。具有转
移性的质粒带有一套与转移有关的基因,它需要移动基因mob、转移基因tra、顺式作用元件bom以及内部转移缺口nic。

3.1.1.2质粒载体必须具备的条件

基因工程质粒是指在染色体外能够独立复制和稳定遗传的一类克隆载体和表达载体。

质粒越大,作为克隆载体的效率就越低。

  • 拷贝数较高。便于实现目的基因的大量复制和扩增。
  • 分子量较小。一般来说,低分子量的质粒通常拷贝数比较高,这不仅有利于质粒DNA的制备,同时还会使细胞中的克隆基因的数量增加,分子量更小更容易分离纯化,转化。
  • 具有筛选标记。质粒的抗性基因是常用的筛选标记,例如氨苄青霉素抗体(Amp^r)、卡那霉素抗体(Kan^r)、四环素抗体(Tet^r)

β-半乳糖苷酶筛选系统也是一个常用的非常方便的筛选系统。

质粒上带有一个来自大肠杆菌的lac操纵子的lacZ'基因,编码β-半乳糖苷酶氨基端的一个蛋白片段(a片段)。利用诱导剂IPTG (异丙基-β-D-硫代半乳糖苷)可以诱导该蛋白片段的合成,这个片段能与宿主细胞所编码的β-半乳糖苷酶羧基端的一个蛋白片段(LacZOM15)进行a互补。在培养基中有IPTG诱导物时,细菌含有编码lacZ'基因的质粒,同时含有LacZ0M15, 就能合成β-半乳糖苷酶的氨基端和羧基端的两种片段,从而在有生色底物X-gal (5-溴-4-氯-3-吲哚-β-D-半乳糖苷)的培养基上形成蓝色菌落。lacZ'基因的中间带有一一个多克隆位点,但MCS并不破坏lacZ ' 基因编码产生的a片段。当外源基因插入多克隆位点后会使lacZ'基因失活,不能表达产生β-半乳糖苷酶的氨基端片段从而破坏a互补作用。因此,目的基因重组质粒的菌落是白色的。利用这种筛选方法可以方便地将含有目的基因的重组子筛选出来(见图3.4)。

  • 具有较多的限制酶切位点,目前大多数都有MCS,较多的单一限制性核酸内切酶酶切位点对外源基因的DNA片段插入提供便利。
  • 具有复制起始位点,可以使繁殖后的宿主细胞维持一定数量的质粒拷贝。但穿梭质粒有两个复制子,一个是元和复制子,一个是真核复制子,既能够在原核细胞中扩增和增殖,又能够在真核细胞中扩增和增殖。这种能够在两种或两种以上的不同细胞内进行复制和扩增的载体,叫做穿梭载体(shuttle vector)。

环状双链DNA分子,含有两个抗药性基因(四环素抗性基因tet^r和氨苄青霉素抗性基因amp^r),一个复制起始位点和多个用于克隆的限制酶切位点。

一般只选择一个抗生素基因的酶切位点作为插入外源DNA之用,外源DNA插入之后改抗生素抗性失效,另一种抗生素抗性基因作为转化细菌后筛选阳性克隆只用。

 但目前基因工程克隆中,常用的克隆质粒载体是pUC系列和pGEM系列的质粒。

pUC18/19包括以下几个部分:

  • 来自pBR322质粒的复制起始位点(ori);
  • 氨苄青霉素抗性基因(amp^r),优化,不再含有基因内原有的限制酶切位点;
  • 大肠杆菌β-半乳糖苷酶基因(lacZ) 的启动子(Plac)、 操作子(lacO)及其编码β-半乳糖苷酶氨基端a-肽链的lacZ'基因;
  • 多克隆位点(MCS),位于lacZ'基因内部靠近5'端的地方,内含13 种限制性内切酶的位点(见图3.5),使含有不同黏端的目的DNA片段可方便地定向插入载体中,并不破坏lacZ'基因的功能。

与pBR322相比具有优点

  • 一是质粒具有更小的分子量和更高的拷贝数,仅保留了氨苄青霉素抗性基因和复制起点。只有2686kb;
  • 二是pUC18质粒结构中增加了lacZ' 基因,编码的ar 肽链可与宿主细胞内的LacZOM15产生的片段进行ar 互补。可用X-gal显色法进一-步对重组子克隆进行鉴定,从而使重组子检测更方便可靠。
  • 三是增加了多克隆位点(MCS)。 pUC18 质粒载体具有与M13mp8噬菌体载体相同的多克隆位点(MCS),可以在这两类载体系列之间来回“穿梭”。因此,克隆到MCS当中的外源DNA片段,可以方便地从pUC18质粒载体转移到M13mp8载体上,进行克隆序列的核苷酸测序工作。同时,也正是由于具有MCS序列,可以使具两种不同黏性末端的外源基因直接克隆到pUC18质粒载体上。

pMD18-T载体是在pUC质粒基础上改建过来的载体,是专门用来克隆PCR扩增产物的

含有与pUC18质粒相同的复制起点,以及amp'和lacZ'标记基因,只是多克隆位点上增加了EcoRV的酶切位点。pMD18质粒经过EcoRV酶切线性化,再在线性末端加上一个T碱基,就得到了线性化的pMD18-T载体。因为用Taq酶做PCR扩增的DNA末端都自动延伸带有一个凸出的A末端,T载体的T末端正好与A末端互补,从而将PCR产物直接克隆到T载体上(图3.8)。

T载体是目前各个实验室应用最广泛、最常用的一个质粒克隆载体。

该载体最大的特点是在lacZ'基因的下游融合了一个ccdB基因,它对大肠杆菌是致死的。pCR-Blunt 的大小为3.5kb,含有卡那霉素抗性基因(kan') 和新霉素抗性基因(zeo5) (图3.10)。

在克隆平末端外源片段时,先将载体切成线状,再与目的基因连接,然后转化大肠杆菌细胞。如果载体发生自连,因为ccdB基因的存在,获得这些载体的大肠杆菌宿主细胞将会死亡。只有当外源DNA片段与载体连接后,ccdB基因的表达受到抑制,含有重组质粒的大肠杆菌便存活下来。这样获得平末端阳性克隆的重组效率可达80%以上。

该载体从pBluescripIISK(+)噬菌粒改造而来,只是将多克隆位点中的Xba I和Spe I位点改成Srf I位点(5'-GCCC/GGGC-3')。克隆DNA片段时,先将载体用Srf I切成线状,再与目的DNA片段混合做连接反应。在连接体系中除了添加T, DNA连接酶外,还加入Srf I酶。

在这个反应体系中,当载体发生自连后,Srf I酶又会将其切开,载体就处于酶切与连接的动态平衡中。只有当载体与目的DNA片段连接后,酶学反应才能稳定下来,从而将总体的反应平衡向载体与目的DNA片段连接这个方向倾斜。

这样的连接反应混合物表现出很高的连接效率,在转化大肠杆菌后通过a-互补筛选出现80%以上的白色菌落,其中90%以上是阳性克隆子。

GEM质粒系列是与pUC系列十分类似的小分子载体。总长度为2743bp, 含有一个氨卡青霉素抗性编码基因(amp') 和一个lacZ' 编码基因。在后者还插人了一段几乎与UC18克隆载体完全一样的多克隆位点。

pGEM系列与pUC系列之间的主要差别是,它具有两个来自噬菌体的启动子,即T启动子和SP6启动子,它们为RNA聚合酶的附着提供寺异性识别位点(图3.11)。 由于这两个启动子分别位于lacZ' 基因中多克隆位点区的两则,若在反应体系中加入纯化的T,或SP6 RNA聚合酶,便可以将已经克隆的外源基因在体外转录出相应的mRNA。

质粒载体pGEM-3Z和pGEM-4Z在结构上基本相似,两者之间的差别仅仅在于SP6和T,这两个启动子的位置互换、方向相反而已

ClonExpress技术是一种简单、快速并且高效的新一代DNA无缝克隆技术,可将外源DNA插入片段定向克隆至任意载体的任意位点。

该技术的关键主要是应用重组酶如ExnaseII能够将具有同源序列的两个线性DNA环化连接,使得目的基因与载体发生同源重组而克隆到载体上

与前述的克隆质粒通过多克隆位点酶切和连接将外源基因插入载体不同,ClonExpress8技术是:

先将载体线性化,并把线性化载体两个末端(约15~20 bp长度)的序列通过PCR引物引人到外源DNA片段的两个末端,这样PCR扩增的外源基因以及线性化载体的末端就都具有两个一致的同源序列了。

最后通过Exnase II 将两个具有同源末端的DNA分子环化连接,形成重组载体DNA分子。再转化细菌,根据标记基因筛选阳性转化子(图3. 13)。

ClonExpress 技术作为新一代重组克隆技术,不依赖酶切和连接反应,建立了一套独特的非连接酶依赖体系,极大地降低了载体自连的概率,且快速高效,无缝连接。

质粒虽然是普遍使用的基因工程载体,但是质粒作为基因运载工具也有它的局限性。

  • 第一,质粒本身比较小,装载目的基因的大小自然也会受到限制。一般目的基因的长度不能超过10kb,否则质粒的转化效率就会大大下降。
  • 第二,质粒进入细胞的方式是通过转化实现的,转化效率一般不高,阳性转化子往往不到受体细胞的1%。
  • 第三,质粒一般只能被转入体外培养的细胞,难于转化在体的动植物细胞。

因此,需要寻求装载能力更强、感染在体细胞效率更高的基因工程载体,如λ噬菌体衍生类型和人工染色体等,它们能容纳更大的DNA插入片段(10~50kb 以上),从而可以克服质粒载体的这些问题。

噬菌体载体与质粒相比,结构要比质粒复杂,但噬菌体感染细胞更有效,克隆产量更高。

λ噬菌体是目前研究得最为清楚的大肠杆菌的一种双链DNA温和噬菌体,也是最早用于基因工程的克隆载体之一。

其线性双链DNA分子的两端各有一个长为12bp的突出的互补单链,称为黏性末端(cos位点)。当λ噬菌体进人大肠杆菌细胞以后,其cos位点能通过碱基互补作用,形成环状DNA分子。cos位点同时也是λ噬菌体包装蛋白的识别位点。λ噬菌体的包装与DNA特性和其他序列无关,包装的DNA大小必须在38~50kd。

λ噬菌体基因组DNA的基因很多,大概分为左侧区与蛋白质合成相关的基因(基因A~J),右侧区与DNA复制和调控相关的基因(位于N基因的右侧)以及中央区(介于基因J~N之间)等三大块(见图3.14)。

左侧蛋白质合成区域又分为头部蛋白合成区域和尾部蛋白合成区域,这些区域的基因合成λ噬菌体的包装蛋白,与子代噬菌体颗粒的形成和包装有关,因此是λ噬菌体基因组的必需区域。右侧复制和调控区域的基因包含λ噬菌体DNA合成、阻遏蛋白及早期和晚期操纵子的主要调控序列,与DNA的复制

以λ噬菌体为基础构建的常用载体可分两类(图3.15):

①替换型载体,这种载体具有两个对应的酶切克隆位点(多克隆位点),在两个位点之间的DNA区段是λ噬菌体复制等的非必需序列,可被外源插入的DNA片段取代,如Charon系列。替换型载体由于去掉了许多DNA序列,所以能克隆较大的外源DNA片段(20~ 25kb)。

②插入型载体,这种载体保留了大部分噬菌体DNA的非必需区段,仅仅增加了一个可供外源DNA插入的多克隆位点以及标记基因(如lacZ),如λgt系列,所以插入型载体只能插入较小的外源DNA片段(小于10kb)。

 λ噬菌体载体的优点是:

  • ①可以携带20kb左右、较大的外源DNA片段。大的外源基因插入片段在质粒中不易稳定,因此,噬菌体和质粒这两种载体可以相互补充。
  • ②通过转导(transduction)将外源基因携带进入细菌细胞,基因转移效率比转化效率更高。
  • ③由于噬菌体包装对DNA长度有要求,噬菌体载体还可避免出现无插入片段的空载体的情况,因为没有插入外源片段的噬菌体DNA长度会小于包装下限将不能正确包装成为有功能的(具有感染性的)病毒。

λ噬菌体载体主要用于基因组文库和cDNA文库的构建。

大肠杆菌丝状噬菌体包括M13噬菌体和f1噬菌体等。

M13噬菌体颗粒的外形呈丝状,其基因组DNA长约6.4kb,成熟的噬菌体基因组为闭合环状单链正链DNA。由于M13单链DNA的复制型呈双链环形,此时的DNA可与质粒DNA一样进行提取和体外操作。且不论是双链还是单链的M13DNA,均能感染寄主细胞,产生噬菌斑或形成侵染的菌落,因此,M13噬菌体也可以作为基因工程载体使用。M13噬菌体感染大肠杆菌后,即在菌体内酶的作用下,以感染性单链DNA (正链)为模板,转变为双链DNA,称作复制型DNA(RF DNA)

一般当每一个细胞内有100~200个RF DNA拷贝时,即停止双链复制,而开始滚环形式的单链复制,最后产生有感染性的完整的单链丝状噬菌体并分泌离开菌体(图3.16)。感染M13的大肠杆菌可继续生长,并不发生裂解,但生长速度较正常细菌慢。

以利用IPTG和X-gal做蓝白斑菌落筛选的(图3. 18)。M13mp18/19 克隆载体的多克隆位点MCS与质粒pUC18/19的多克隆位点相同,两者可以互换外源DNA片段。

 M13噬菌体作为载体的优点是:

①噬菌体的基因组是单链DNA,克隆到此载体的DNA也能产生单链形式的模板DNA。由于位点特异性诱变容易在单链DNA上产生,所以利用这种方法,可以预先对任何一个克隆基因进行DNA诱变,如寡核苷酸引物介导的定点突变(见第4章,用蛋白质工程改建目的基因)。

②同样,单链DNA也使DNA测序容易和方便得多,可以制备单链测序模板。

③在M13噬菌体中的DNA是单链的,但是它感染大肠杆菌细胞后,单链将变换为双链DNA的复制型(RF)。 用于克隆的正是这种双链复制型的噬菌体DNA。用一种或两种限制性核酸内切酶切割其多克隆位点后,具有同样酶切末端的外源DNA片段便可以插人这个载体的相应酶切位点了。然后用这种重组DNA转化到宿主细胞中,转化细胞能产生单链重组DNA的子代噬菌体。

④含有噬菌体DNA的噬菌体颗粒从转化细胞中分泌出来后,可以在生长平板上收集它们。

M13载体除了它的优点外,也存在着插入片段过短和不稳定等问题。当外源片段超过1kb时,在M13噬菌体的增殖过程中会发生缺失。

带有cos位点的质粒。黏粒(cosmid)是柯斯质粒,是由λ噬菌体的cos序列,质粒的复制子序列及抗生素抗性基因序列组合、人工构建的一类特殊质粒载体。

cos序列是DNA包装进噬菌体颗粒所必须的。复制子通常是ColE1或pMB1的复制起始位点。

  • 具有λ噬菌体的特性。因为黏粒含有cos位点,可以被λ噬菌体包装蛋白包装,之后可以在克隆之后转导对λ噬菌体敏感的大肠杆菌,在宿主体内按λ噬菌体的方式环化,但是由于不含有λ噬菌体的其他组件,所以细胞不会裂解,可以稳定存在。
  • 具有质粒特征,具有复制子结构,可以像其他质粒一样复制,并与松弛型质粒相同,适量的氯霉素可以促进扩增。又具有抗生素基因,可以通过抗生素抗性筛选重组子。可以加上设在筛选标记基因内会导致插入失活的多克隆位点。
  • 克隆外源DNA的容量大。可以克隆完整的真核生物基因。
  • 能与同源序列的质粒载体进行重组。

黏粒可以在细菌细胞中永久保存或被体外(in vitro)包装进噬菌体而得到纯化。

  • 一方面,经过限制性核酸内切酶切割产生的线性柯斯质粒载体DNA,彼此间会连接形成多聚体分子,即自我重组,且也可被包装蛋白识别包装形成克隆子,这样一来降低了含有外源DNA重组子的重组频率;
  • 另一方面,经限制性核酸内切酶部分消化的真核生物基因组产生出来的DNA片段,在随后的连接反应中往往会出现由两个或多个片段随机再连接的情况,而它们的结合顺序并不符合在真核基因组中的固有排列顺序,因此,使用含有这种插入片段的克隆做DNA序列分析时,所得出的DNA在染色体上的排列可能是错误的。
  • 3.1.4人工染色体载体

人工染色体载体是利用真核生物染色体或原核生物基因组的功能元件构建的能克隆50kb以上DNA片段的人工载体。

其中有的载体既可用于克隆,又能直接转化,是进行基因功能研究的良好载体。

近年来陆续发展起来的人工染色体载体有酵母人工染色体(YAC)细菌人工染色体(BAC)以及P1人工染色体(PAC)Ti质粒人工染色体(TAC)等。

最早的YAC是由Murray等于1983年构建的,克隆载体中包含真核细胞染色体的三个必要元件:即着丝粒、端粒、复制起始序列和外源DNA序列,总长约55kb。

存在:适合酵母菌的DNA复制起始位点(ARS1), 染色体分裂时保证染色体能正确进入子代细胞所需要的着丝粒(CEN4)和确保染色体完整性维持和染色体成为线状的端粒结构(TEL)。除了复制需要的元件以外,YAC还有三个选择性标记,如色氨酸合成酶基因(TRP1)、尿嘧啶合成酶基因(URA3),还有一个含有Sma I和EcoR I位点的多克隆位点(图3.21)。

在插入外源DNA之前,YAC克隆载体保持着环形结构。在端粒(TEL) 序列的末端有一个BamH I的酶切位点,如果用BamH I酶切将得到一个线形分子,它的末端成为类似于真正染色体的端粒,这将赋予这个线形分子稳定性。用Sma I或EcoR I处理将产生可以插入外源DNA的末端。

同时用BamHI和EcoRI酶切将产生两个线形分子,每一个分子的一-端含有一个端粒序列,还有一个平末端,供连接外源DNA片段。每一个臂含有一个:选择性标记(TRP1在左臂,URA3在右臂),以便排除掉单个臂和外源片段连接起来的分子。

多克隆位点上的SUP4标记可以用来区分未被酶切的空载体和与YAC重组连接成的分子。相对细菌质粒而言,YAC可以运输的外源DNA片段更大,插入片段可以达到平均800~1000kb,最大甚至可以达到2Mb。

YAC是至今为止装载容量最大的克隆载体,被称为“mega'”(百万碱基) YAC,所以很适合用于构建高等生物复杂基因组的基因文库。

YAC克隆载体的装载容量大是其主要优点,但是它也有明显的缺点:

①在构建的基因组克隆文库中含有大量的嵌合体(chimeric) 克隆存在(40%~50%)。 嵌合体是由不同染色体来源的DNA片段连接在一起构成的克隆,它给研究造成较大的麻烦。

②YAC克隆使DNA分离困难。YAC的大小和性质与酵母染色体无明显差异,不能用简单的方法分离纯化YAC的DNA,在脉冲凝胶电泳上有时也与酵母染色体相重叠,以至于很难得到纯化的

将外源目的基因导入受体细胞中进行克隆不是基因工程的目的,实现目的基因的表达、产生新的基因产物并让受体生物获得可预期的性状才是真正目的。

表达载体(expression vector):含有各种表达调控元件,能够使目的基因在宿主细胞中表达的载体。

除了必须具备与克隆载体相同的复制原点、多克隆位点和筛选标记基因等,还需要具备控制目的基因表达的调控序列,包括启动子、转录终止子等,克隆到表达载体上的目的基因也必须具备完整的起始密码子、终止密码子和核糖体结合位点,才能产生完整的目标蛋白。

3.2.1原核表达载体

原核表达载体是指促使目的基因在原核细胞中表达的载体。

原核表达载体除了复制起点(ori)和筛选标记以外。还需要具有原核细胞的启动子和终止子,才能实现基因的表达。

其中启动子位于多克隆位点MCS的5'端终止子位于多克隆位点的3'端,目的基因是插在多克隆位点上的。为了保证核糖体能够与目的基因的mRNA结合,进一步开启翻译的过程,往往还需要在多克隆位点上游加一个原核细胞核糖体识别和结合位点SD。所以“启动子+SD+ MCS+终止子”就构成了目的基因在原核细胞的表达盒(图3. 24)。

大肠杆菌是目前应用最广泛的蛋白质原核表达系统。

大肠杆菌作为外源基因表达系统的优点是:

  • ①繁殖迅速、培养简单、操作方便、遗传稳定;
  • ②基因克隆及表达系统成熟完善;
  • ③全基因组测序完成,共有4405个开放阅读框架;
  • ④被美国FDA批准为安全的基因工程受体生物。

3.2.1.1大肠杆菌表达载体的调控元件

大肠杆菌表达载体都是质粒载体

基本骨架是最简单的质粒克隆载体中的复制起点氨苄青霉素抗性基因,相当于pUC类的载体。在基本骨架的基础上增加表达元件,就构成了表达载体。各种表达载体的不同之处在于其表达元件的差异。

启动子是DNA链上一段能与RNA聚合酶结合并起始RNA合成的序列,它是基因表达不可缺少的重要调控序列。由于细菌RNA聚合酶不能识别真核基因的启动子,因此,原核表达载体所用的启动子必须是原核启动子。

原核启动子的核心序列是由两段彼此分开且又高度保守的核苷酸序列组成的,对mRNA的合成极为重要。在转录起始位点上游5~10bp处,有一段由6~8个碱基组成、富含A和T的区域,称为Pribnow盒,又名TATA盒或一10区。来源不同的启动子,Pribnow盒的碱基顺序稍有变化。在距转录起始位点上游35bp处,有另一段由10bp组成的区域,称为-35区。转录时大肠杆菌RNA聚合酶识别并结合启动子。-35区与RNA聚合酶σ亚基结合,一10区与RNA聚合酶的核心酶结合,在转录起始位点附近DNA被解旋形成单链,RNA聚合酶使第一和第二核苷酸形成磷酸二酯键,以后在RNA聚合酶的作用下向前推进,形成新生的RNA链。

原核表达系统中常使用的启动子包括Lac (乳糖操纵子的启动子)、Trp (色氨酸操纵子的启动子)、Tac (乳糖和色氨酸操纵子的杂合启动子)、PxL(λ 噬菌体的左向启动子)以及T,噬菌体启动子等(表3.2)。

3.2.1.2诱导表达系统(重点)

lac启动子和tac启动子都含有乳糖操纵子的lacO序列,可以受lacI产生的阻遏蛋白的负调节,而诱导物乳糖可以与阻遏蛋白结合,解除这种负调节。这便是乳糖操纵子的调控原理。

乳糖操纵子的调控元件是由调节基因lacI、启动子lacP和操作子lacO组成的。

野生型状态时,乳糖是这个操纵子的诱导剂。在没有乳糖时,调节基因产生的阻遏蛋白会结合在操作子lacO上,阻止RNA聚合酶与启动子结合,启动子下游的目的基因只能基底水平转录。当有乳糖存在时,诱导剂与阻遏蛋白的亲和力高,把阻遏蛋白从操作子序列上拉下来,RNA聚合酶就可以稳定地与启动子结合,促使目的基因高效转录

在基因工程操作中,lac 启动子的诱导剂换成了IPTG (isopropyl-β -D- thiogalactoside,异丙基-β-D-硫代半乳糖苷),是一种乳糖类似物,与阻遏蛋白的亲和力比乳糖还要高,它就好比是控制乳糖启动子的开关。

  • 有IPTG诱导,lac 启动子和tac启动子下游的目的基因就会表达。
  • 无IPTG诱导,目的基因始终处于关闭的状态。通过这种诱导型启动子,可以实现目的基因表达的精确调控。

此外,野生型乳糖操纵子的诱导表达除了依赖乳糖的诱导,还要依赖葡萄糖的水平,因为有葡萄糖存在时,细菌优先利用葡萄糖,不会利用乳糖。(葡萄糖效应/葡萄糖阻遏)

只有当葡萄糖不存在时,乳糖才具有开启启动子的功能。

在基因工程操作中,乳糖操纵子的启动子经过了诱变改造,变成了突变型的启动子PaeUV5 (图3.25),启动子的一10区由野生型的TATGTT序列变成了一致序列TATAAT。这一突变结果导致PaUV5的一10区与RNA聚合酶的σ因子亲和力增强,以至于RNA聚合酶不需要CAP-cAMP复合物的协助也能稳定结合到启动子,启动转录。

因此,启动子PaUV5只受诱导剂IPTG的调控,而不再受葡萄糖水平的影响,因而更有利于人为操控基因的表达。

含有lac 或tac启动子的载体系统有pUC、pGEM、pM13、λ噬菌体、pET、pGEX等系列载体。

如上所述,大肠杆菌是一个非常成熟又简便的基因表达系统,大肠杆菌的lac启动子可诱导表达,便于人为操控。细胞内又有现成的大肠杆菌RNA聚合酶可以使用,因此,任何外源目的基因都可以转人大肠杆菌细胞,开启它的表达。

但是基因工程载体上的启动子大量使用大肠杆菌自身基因的启动子,也有不利的一面。

  • 一是载体既然使用大肠杆菌基因的启动子,就必定要使用大肠杆菌RNA聚合酶进行转录,而大肠杆菌细胞内的RNA聚合酶只有唯一的一种,除了要满足载体上目的基因的转录之外,还要保障大肠杆菌自身基因组上大量基因的转录,所以会“忙不过来”,工作效率不高。
  • 二是在诱导载体上目的基因表达的同时,大肠杆菌基因组基因也很容易被诱导表达,或者会渗漏表达(leaky expression,是指本来不表达或低表达的基因,在某些情况下意料之外的低表达),造成RNA聚合酶活性的浪费。
  • 三是既然基因组基因也表达,目的基因也表达,必然导致目的蛋白的表达量不高,且会混杂在众多基因组基因的表达产物中,分离也很困难。如果载体携带目的基因进人大肠杆菌细胞后,只有载体上的目的基因专一表达,而细菌细胞内其他基因都不表达或少表达,将是目的基因理想的表达系统。T7启动子载体系统可望实现目的基因的专一性高效表达。

T7启动子来自于T噬菌体的启动子,具有高度的特异性,只有T7 RNA聚合酶才能使其启动,故可以使载体上的目的基因独立于宿主细菌基因组之外得到表达。

T7RNA聚合酶合成RNA的效率比大肠杆菌RNA聚合酶高5倍左右,它能使质粒沿模板连续转录几周,许多外源终止子都不能有效地终止它的转录,因此,它可转录某些不能被大肠杆菌RNA聚合酶有效转录的序列。这个系统可以高效表达其他系统不能有效表达的基因。但要注意用这种启动子时宿主中必须含有T7 RNA聚合酶。

因此,应用T7噬菌体表达系统需要2个条件:

  • 第一是宿主细胞必须具有T,噬菌体RNA聚合酶,它可以由感染的λ噬菌体或F因子先将T RNA聚合酶的基因事先转人大肠杆菌细胞;
  • 第二是在一个待表达基因上游带有T,噬菌体启动子的载体。

T7噬菌体RNA聚合酶高效表达系统的优点有:

  • ①T7噬菌体RNA聚合酶合成RNA的速度高于大肠杆菌5倍;
  • ②T7噬菌体RNA聚合酶只识别自己的启动子序列,不启动大肠杆菌DNA任何序列的转录;
  • ③T7噬菌体RNA聚合酶对抑制大肠杆菌RNA聚合酶的抗生素有抗性;
  • ④T7噬菌体RNA聚合酶/启动子系统在一定条件下,基因表达产物可占细胞总蛋白的25%以上。

由于T7启动子的专一性和高效性,T7启动子也常常被用于构建体外基因表达系统,如pBCSK体外转录质粒,以及真核细胞pcDNA3.1质粒,都在目的基因一端含有T7启动子,只要加入成熟的T7 RNA聚合酶,就可以在体外使目的基因转录,获得高表达的目的基因RNA,制备杂交探针或RNA产品。

3.2.1.4大肠杆菌融合蛋白表达系统

如前所述,目的基因被表达载体携带转入受体细胞后,可在T7启动子等强启动子的带领下实现高表达。

但是,目的基因是外源基因,表达产生的目的蛋白是异源蛋白,它在受体细胞内能稳定存在吗?目的蛋白是可溶的吗?当表达量高了以后,目的蛋白会不会聚集在一起形成不可溶的包涵体?目的蛋白在受体细胞内能不能形成有活性的空间结构?以及,目的蛋白表达后容易分离吗?尤其是对于真核生物的基因,被转入原核细胞进行表达后,不可避免地会出现此类问题。将目的基因与某些已知的、高表达的可溶性蛋白的基因进行融合表达,可有效解决这类问题。

(1) 融合蛋白表达的概念

蛋白质的融合表达是指外源基因与载体已有的担体蛋白的编码基因拼接在一起,并作为一个新的开放阅读框进行表达。

载体的担体蛋白基因可以是上述的载体标记基因,从而可以通过标记基因的表达而直观地判断目的基因的表达情况。担体蛋白也可以是可溶性的高表达蛋白,从而保证跟目的蛋白融合后目的基因高表达且产生可溶性的目的蛋白。

融合表达的时候,担体蛋白可以位于融合蛋白的N端,也可以位于融合蛋白的C端(图3.29)。

载体上的担体基因是什么?

担体基因是指载体上携带的已被证明能稳定表达并产生可溶性蛋白产物的基因,比如lacZ基因,它表达产生可溶性的β半乳糖苷酶。当目的基因与lacZ基因融合表达后,目的蛋白也具有很好的可溶性。

此外,担体基因往往还具备以下特点。

  • ①容易标识和跟踪。如lacZ和GFP基因,它们本身是载体上的标记基因,当与目的基因融合表达后,标记基因的产物不受影响,却很容易根据标记基因的表达情况追踪目的基因的表达。又如FLAG和Myc等标签蛋白基因,都有商业化生产的专一抗体提供。当这类.标签蛋白基因与目的基因融合表达后,通过标签蛋白的专一抗体进行免疫检测,也很容易追踪到目的蛋白的表达情况(图3.
  • ②能够帮助目的蛋白形成正确的空间结构。这类担体基因包括谷胱甘肽S转移酶的基因GST、硫氧还蛋白基因TrxA及小分子蛋白修饰基因SOMO和Ubi等。目的蛋白只有形成正确的空间结构,才会具有活性。但是,当真核生物基因转人原核细胞后,由于原核细胞内缺乏相应的蛋白质加工系统,导致目的蛋白常常不能形成有活性的空间结构而不能发挥正常的功能。而这些担体蛋白可以充当分子伴侣的作用,帮助目的蛋白正确折叠,形成有活性的空间结构。
  • ③能够帮助目的蛋白容易从受体细胞总蛋白混合物中分离纯化出来(图3.31)。 担体蛋白要么具有专- -性好的抗体,如FLAG和Myc,可以利用结合有FLAG或Mye的专一抗体的琼脂糖柱,把带有FLAG和Myc标签的目的蛋白分离出来。要么具有专一作用的底物,如lacZ、GST和MBP基因等。lacZ 基因的产物β-半乳糖苷酶,能特异结合乳糖及其类似物,把乳糖类似物如β硫代半乳糖苷交联在亲和色谱柱上,就可以把与lacZ融合表达的目的蛋白分离。同样地,GST表达的谷胱甘肽S转移酶的作用底物是谷胱甘肽,融合蛋白可以通过交联有谷胱甘肽的琼脂糖柱子亲和色谱分离。麦芽糖结合蛋白MBP构建的融合蛋白则可以通过直链淀粉柱色谱分离。还有一-种情况是担体蛋白具有专一性作用的配体或配基,如多聚组氨酸,能够特异结合二价镍离子,组氨酸标签的融合蛋白可以通过Ni2+ -NTA的琼脂糖柱分离。

(2) 融合蛋白表达载体

融合蛋白表达载体是应用最广泛的表达载体。

①GST融合表达载体。谷胱甘肽转移酶(GST)表达载体有pGEX载体组成。如pGEX-4T-1, 在启动子tac和多克隆位点之间加人了2个与分离纯化有关的编码序列,其一是谷胱甘肽转移酶基因(GST),其二是凝血蛋白酶(thrombin) 切割位点的编码序列(图3.32)。 当外源基因插人到多克隆位点后,可表达出由三部分序列组成的融合蛋白。

GST是来源于血吸虫的小分子酶(26X10*),在E.coli易表达,在融合蛋白状态下保持酶学活性,对谷胱甘肽有很强的结合能力。将谷胱甘肽固定在琼脂糖树脂上形成亲和色谱柱,当表达融合蛋白的全细胞提取物通过色谱柱时,融合蛋白将被吸附在树脂内,其他细胞蛋白就被洗脱出来。然后再用含游离的还原型谷胱甘肽的缓冲液洗脱,可将融合蛋白释放出来。再用凝血蛋白酶切割融合蛋白,便可获得纯化的目的蛋白。

②组氨酸标签表达载体。利用组氨酸标签的表达载体有很多,在pET系列载体中也有,如前面叙述的pET28a及 pET16b。其主体框架与pET5a相似,除了多一个lacI 基因外,主要差别在于在启动子下游含有一段编码6个组氨酸的序列和编码Xa因子酶切位点的序列。当外源基因插入到 Bam HI等位点后,在BL21 (DE3)菌株中可表达出带His-6标签的融合蛋白。多聚组氨酸肽能与2价重金属阳离子结合,如镍离子(Ni2+)。如镍离子固定在树脂上,便可对带His标签的融合蛋白进行亲和色谱分离。纯化的融合蛋白再用Xa因子处理可去除标签蛋白,获得目标蛋白。

(3)目的蛋白与担体蛋白的分离

目前已经建立了数种对融合蛋白进行位点特异性裂解的方法。方法的选择常由特定蛋白的组成、序列及物理性质决定。基本方法有以下两种。

Pro)来进行融合蛋白的化学裂解。化学裂解的方法比较便宜而且有效,甚至常常可以在变性条件下裂解非变性不能溶解的蛋白质。但有时因目的蛋白中存在裂解位点﹐或者因为发生了副反应而导致对蛋白质进行了不需要的修饰,从而阻碍了它们的应用。

②酶解。酶解的方法相对来说反应条件比较温和,更重要的是,普遍用于此用途的蛋白酶都具有高度专一性,酶处理法可以大大降低发生意外切割的可能性。其中常用的酶有凝血酶、肠激酶、Xa因子、凝乳酶、胶原酶等。所有这些酶都具有较长的底物识别序列(比如在凝乳酶中为7个氨基酸),从而降低了蛋白质中其他无关部位发生断裂的可能性。在上面所提及的各种酶中,肠激酶和凝血酶应用最多,因为它们切割各自的识别序列的羧基端﹐就使带有天然氨基端的被融合部分得以释放。凝血酶的识别和切割序列是Leu-Val-Pro-Arg,Xa因子的识别和切割序列是Ile-Glu-Gly-Arg。如GST融合系统的载体含有凝血酶裂解位点或Xa因子裂解位点(图3.33)。

(4)融合表达系统的优点

蛋白质的融合表达有许多优点:

①与高表达的担体蛋白共同表达,可以保证目的蛋白的表达率高,稳定性好;

②担体蛋白常常是结构和功能研究得比较清楚的蛋白质,通过免疫亲和色谱等方法很容易对担体蛋白进行分离和纯化,从而将融合在一起的目的蛋白也有效分离出来;

③还有一些担体蛋白能帮助目的蛋白生成折叠正确、有生物活性的蛋白质,形成正确的空间结构﹔

④通过化学裂解和蛋白酶很容易将N端的担体蛋白部分从C端的目的蛋白中裂解出来,有利于对目的蛋白进行生物化学研究及功能分析。

(5)构建融合蛋白表达载体的注意事项

在分子克隆和基因工程操作中,融合蛋白表达载体是使用最多的工具载体。因此,在构建融合蛋白表达载体时一定要注意如下几点。

①目的基因片段的插入方向。要保证目的片段正向插入载体的多克隆位点,在通过双酶切连接目的基因及载体时这一问题往往不用担心,在单酶切制备载体时需要对载体中目的基因的插入方向做进一步的鉴定,保证目的基因正向插入载体,而不是相反。

②目的基因的移码问题。融合蛋白的表达就是由担体蛋白(融合标签)基因和目的蛋白基因共同组成-一个开放阅读框(ORF)来表达的,如果担体蛋白(融合标签)基因在融合蛋白表达载体的表达调控启动子下游,担体蛋白基因下游是供目的基因连接的多克隆位点,融合蛋白表达ORF的起始密码子必须在担体基因上,与载体连接之后目的基因自身的ORF可能会存在移码的问题

如当使用pET28b或pET28c载体时,有时需要在目的基因片段的下游引物加上或减去一个碱基,以保证C端的6个His 标签能完整表达。当使用pET28a时,只要目的基因正常读码,C端的His标签就能完整表达。在实际操作中,我们可以通过软件分析连接后的载体的读码情况,判断融合标签及目的基因能否正常表达。

终止密码子问题。当融合蛋白载体的结构是启动子担体基因-目的基因这种类型时,担体蛋白一般带有起始密码子,但不会带终止密码子。在载体的多克隆位点后面可含有终止密码子,以保证空载体担体蛋白的表达。但很多时候要求目的基因必须带有终止密码子,才能保证ORF的完整。如果载体的结构是启动子-目的基因-担体基因这种类型时,要求目的基因必须带起始密码子,但一定不能含有终止密码子,否则担体蛋白不能表达。

entrysite,IRES)。IRES序列来源于脑心肌炎病毒,它可翻译一条mRNA上的两个开放阅读框,由其连接的两个基因的表达率相同。在构建融合蛋白表达载体时,以往都是将担体基因与目的基因共同构建一个开放阅读框,一个贡献起始密码子,另一个贡献终止密码子,组成融合蛋白表达。

⑤2A序列的引入。2A是一种具有自我加工能力的蛋白酶,在不同病毒中它的长度、作用位点各不相同。如在口蹄疫病毒中的2A序列有长短两种类型,长型有201bp,编码39个氨基酸,短型有96bp, 编码17个氨基酸。两者作用相似,均可独立的用于构建双基因或多基因表达载体。构建载体时,将两基因分别克隆到2A序列的两侧,去除上游基因的终止密码子形成单一的开放阅读框(图3. 37),翻译出的多聚蛋白可在编码2A区域的C末端被切割为两个蛋白,上游蛋白融合了2A的C端多肽,并释放出完整的下游蛋白。

引人2A序列的优点是: 2A的切割位点在自身C端最末位的两个氨基酸之间(甘-脯),切割作用伴随翻译过程的完成,切割活性高达85%~99%,因此可用于与IRES序列- -起构建多顺反子表达载体。研究表明,两个近邻的IRES序列可能会降低基因的表达。因此,2A 序列在构建多顺反子时是IRES序列的有益补充。

将目的蛋白的基因置于原核蛋白信号肽序列的下游能够实现分泌表达。

信号肽通常是由15~30个疏水氨基酸残基组成的,在其N端的小段肽链是以带正电荷的赖氨酸和精氨酸为特征,随后是一段以疏水氨基酸为主的肽段,在邻近切割位点处常有几个侧链很短的氨基酸,如甘氨酸、丙氨酸等。其中N端带正电荷的一段有助于新生肽链与带负电荷的细胞质膜结合;信号肽中的疏水肽段能够形成a螺旋结构,而且信号肽序列之后的一.段氨基酸残基也能形成一段a螺旋,这两段螺旋以反平行的方式形成发夹结构之后,容易进人内膜的脂双层;邻近切割位点的氨基酸倾向于形成β折叠,这可能是信号肽酶所识别的结构。

除此之外,信号肽后面的氨基酸也影响蛋白质的穿膜和随后的切割。周质蛋白、细胞内膜蛋白和外膜蛋白以带有N端信号肽的前体形式在细胞质中合成,随后穿膜运送到周质或定位到内、外膜上。在穿膜的过程中,信号肽被信号肽酶切除。

实现蛋白质的分泌表达有许多优点:

①在分泌过程中蛋白质前面的信号肽被切除后生成的蛋白质的N末端氨基酸残基和天然的产物是一致的;

②周质空间中的蛋白酶的活性要比胞质中的低,这使所表达的蛋白能稳定的存在于周质中;

③周质中只有少量的细菌蛋白,它们仅占细菌总蛋白的4%,所以这使得重组蛋白更易纯化;

④周质空间中提供了一个氧化的环境,更有利于二硫键的正确形成。

鉴于以上这些优点,对于许多难以纯化的蛋白可以通过构建分泌型表达载体来实现分泌表达

利用信号肽序列作为融合标签可将融合蛋白分泌到细胞外,可利用的信号肽有碱性磷酸酶的信号肽和蛋白质A的信号肽。

当要把真核生物基因放人原核细胞中表达产生蛋白质时,原核系统就表现出许多缺陷:

①没有真核生物基因转录后加工的功能,不能进行mRNA的剪接,所以只能表达cDNA而不能表达真核生物的基因组基因;

②没有真核生物蛋白质翻译后加工的功能,表达产生的蛋白质,不能进行糖基化、磷酸化等修饰,难以形成正确的二硫键配对和空间折叠构象,因而产生的蛋白质常没有足够的生物学活性;

③表达的蛋白质经常是不溶的,会在细菌内聚集成包涵体(inclusion body),尤其是当表达目的蛋白量超过细菌体总蛋白量的10%时,就很容易形成包涵体。

生成包涵体的原因可能是蛋白质合成速度太快,多肽链相互缠绕,缺乏使多肽链正确折叠的因素,导致疏水基团外露等。细菌裂解后,包涵体能够被离心沉淀下来,虽然有利于目的蛋白的初步纯化,但无生物活性的不溶性蛋白,要经过复性(renaturation),使其重新散开、重新折叠成具有天然蛋白构象和良好生物活性的蛋白质,常常是一件很困难的事情。也可以设计载体使大肠杆菌分泌表达出可溶性目的蛋白,但表达量往往不高。要表达真核生物的蛋白质,采用真核表达系统自然应比原核系统优越,常用的真核表达系统有酵母、昆虫、动物和哺乳动物细胞等表达系统。

真核表达载体至少要包含两类序列:

①原核质粒的序列,包括在大肠杆菌中起作用的复制起始序列、能用在细菌中筛选转化子克隆的抗药性标记基因等,以便插入真核基因后能先在大肠杆菌系统中筛选获得目的DNA重组克隆、并复制繁殖得到足够使用的数量。

②在真核宿主细胞中表达目的基因所需要的元件,包括启动子、增强子、转录终止子和加poly(A)信号序列、mRNA剪接信号序列、能在真核细胞中复制或增殖的序列、真核细胞中筛选的标记基因以及供外源基因插人的单一限制性内切酶酶切位点等。

3.2.2.1真核表达载体的组成成分

为了能在大肠杆菌中增殖,得到大量能转染哺乳动物细胞的重组DNA分子,哺乳动物表达载体中通常有一段原核序列,包括一个能在大肠杆菌中自我复制的复制子、便于在细菌中挑选重组子的筛选标记基因以及便于把真核序列插入载体的多克隆位点。

当具备这些序列以后,外源的真核基因序列可在多克隆位点插人载体中,形成的重组DNA可在大肠杆菌中增殖,经标记基因筛选后进行DNA提取、酶切或测序检测,一方面可以保证目的序列的正确性,另一方面可以增殖得到大量的目的基因的DNA序列。所以,真核表达载体往往是“穿梭载体”,即能够在两种或两种以上的不同宿主细胞中复制和增殖的载体。

真核生物的启动子区域位于TATA区上游100~230bp之间,TATA区位于转录起始点上游25~30bp处。启动子的转录效率因细胞而异。因此需根据宿主细胞类型选择不同的启动子。如PCMV是真核表达载体常用的强启动子。另外也有许多组织和器官特异性的启动子,如心脏特异启动子CMLC启动子等。

增强子是使启动子的基因转录效率显著提高的一类顺式作用元件,由多个独立的核苷酸序列组成。它们的作用通常不具有方向性,在位于转录起始点的下游或离启动子很远的地方仍有活性。许多增强子只能在特定的组织或细胞中起作用,即具有组织表达的特异性,因此,在构建真核表达载体的时候,应根据宿主细胞来选择特异性表达的增强子。

真核生物基因往往由许多内含子和外显子组成。基因组基因被转录成mRNA前体以后,需通过剪除内含子、连接外显子才能成为成熟的mRNA。一般mRNA拼接需要的基本序列位于内含子的5’和3'末端,因此,改变拼接位点5'和3'末端两侧的外显子序列可能会影响邻近拼接位点的使用效率,在替换外显子时应注意。

(5)终止信号和多聚腺苷化的信号

转录的终止信号常常位于多聚腺苷化位点下游的一段长度为几百个核苷酸的DNA区域内。多聚腺苷化需要两种序列:位于腺苷化位点下游的GU丰富区或U丰富区位于腺苷化位点上游11~30个核苷酸处的一个由6个碱基组成并高度保守的AAUAAA序列。为了保证目的基因的mRNA能有效地多聚腺苷化,真核表达载体上必须包括多聚腺苷化下游的一段序列。最常用的方法是用SV40的一段237bp长的BamH I-Bcl I限制性片段,含有多聚腺苷化(多A,茎环结构)的信号。另一种方法是将全长cDNA与已组装在表达载体上一个顺式作用因子的部分片段融合,提供多聚腺苷化的信号。

NEO)等。酵母菌表达载体所采用的选择标记则常用营养缺陷型选择标记,如氨基酸和核苷酸生物合成基因LEU、TRP、HIS、LYS、URA、ADE等。

3.2.2.2酵母细胞表达载体

(1)酵母表达载体概述

酵母表达系统能够克服大肠杆菌表达系统的不足,可以进行蛋白质翻译后的修饰和加工。而且像大肠杆菌一样,酵母细胞全基因组测序也已经完成,基因表达调控机理比较清楚,遗传操作简便,酿酒酵母的发酵历史悠久、技术成熟、工艺简单、成本低廉,能将外源基因表达产物分泌至培养基中,不含有特异性的病毒,不产生内毒素,也被美国FDA认定为安全的受体细胞。所以酵母表达系统也是基因工程广泛应用的表达系统之一。

酵母的表达载体主要有两类:

一是自主复制型质粒载体(YRp),含有酵母基因组的DNA复制起始区、选择标记基因和基因克隆位点等元件,能够在酵母细胞中进行自我复制。在酵母细胞中的转化效率较高,每个细胞中的拷贝数可达200个,但经过多代培养后,子细胞中的拷贝数会迅速减少。

二是整合型质粒载体(YIp), 不含酵母DNA复制起始区,不能在酵母中进行自主复制,但含有整合介导区,可通过DNA的同源重组将外源基因和部分载体片段整合到酵母染色体上,并随染色体一 起进行复制。

早期主要应用酿酒酵母表达系统,但也有其局限性,如缺乏强有力的启动子,分泌效率差,表达菌株不够稳定,表达质粒易于丢失等。有鉴于此,人们发展了新一代的酵母表达系统一巴斯德毕赤酵母(Pichia pastoris) 表达系统。巴斯德毕赤酵母能利用甲醇作为唯一碳源提供能量,故又称它们为嗜甲醇酵母或甲醇酵母。

(2)甲醇酵母表达系统

甲醇酵母之所以能利用甲醇作为碳源,是因为甲醇酵母含有乙醇氧化酶基因。乙醇氧化酶能将甲醇氧化成甲醛,提供酵母生长的能量。甲醇酵母中有两个乙醇氧化酶基因: AOX1和AOX2。AOX1的乙醇氧化酶活力很强。调控乙醇氧化酶基因表达的启动子是强启动子,可用来调控异源蛋白的表达。当以甲醇为唯一的生长碳源时,AOX1基因的表达受甲醇严格调控,并被诱导到相当高的水平,表达的乙醇氧化酶可占整个细胞可溶蛋白的30%以上。甲醇酵母中没有稳定的质粒,所以其表达载体采用整合型质粒。Invitrogen公司构建了多种甲醇酵母表达载体,如胞内表达的pPIC3.5K及分泌表达的pPIC9K载体等。

pPIC9K载体的组成成分

  • 编码a因子N末端信号肽序列Sig (S),可引导蛋白分泌;
  • 有卡那霉素基因,使得甲醇酵母阳性转化子能抗G418,有助于筛选;
  • 5'AOX1 强启动子,可调控异源蛋白表达;
  • MCS,多克隆位点,允许目的基因插入;
  • TT,转录终止和多聚腺苷酸化序列,允许mRNA有效转录终止和多聚腺苷化;
  • 3'AOX1及其TT序列下游区域; His4, 编码组氨酸,提供转化子的筛选标记;
  • amp',氨苄抗性基因,允许在大肠杆菌中筛选(图3.39)。

3.2.2.3哺乳动物细胞系表达载体

哺乳动物细胞表达系统是指采用某种方式将外源基因导入细胞,在哺乳动物细胞中表达获得具有一定功能的蛋白质,这一类真核基因的表达系统称为哺乳动物细胞表达系统

哺乳动物细胞不仅可以表达克隆的cDNA基因,而且还可以表达真核基因组的DNA基因。哺乳动物细胞表达的蛋白通常可以被适当的修饰,而且表达的蛋白质会恰当地分布在细胞的一定区域并积累。哺乳动物细胞系可以悬浮培养、生长快,能够连续传代,而且能够精确的糖基化,又能实现胞外表达,尤其是对于人类基因来说,人本身的细胞系就是人自身的表达系统,因此比其他真核生物更能反映人类自身活性蛋白的真实表达、加工、定位和精确修饰情况。

目前已建立了许多哺乳动物和人细胞系,如HeLa细胞系、HEK293 细胞系、COS细胞系、CHO细胞系等。

  • 哺乳动物细胞系的表达载体有两种,一类是瞬时转染载体,另一类是稳定转染(永久转染)载体
  • 瞬时转染载体所携带的外源DNA/RNA不整合到宿主染色体中,因此一个宿主细胞中可存在多个拷贝数,产生高水平的表达,但通常只持续几天,多用于启动子和其他调控元件的分析。

稳定转染载体的外源DNA既可以整合到宿主染色体中,也可作为一种附加体(episome) 而稳定存在于细胞中。外源DNA整合到染色体中的概率很低,大约1/10^4转染细胞能整合,所以通常需要通过一些选择性标记如潮霉素B磷酸转移酶(HPH)、胸苷激酶(TK)等基因反复筛选,得到稳定转染的同源细胞系。

基因工程载体分为克隆载体和表达载体两种。

克隆载体是能够帮助目的基因在受体细胞中复制和扩增的载体,包括质粒载体、噬菌体载体、黏粒及人工微小染色体。常用的克隆质粒包括pBR322、pUC18/19、pMD18-T、pGEM系列、pBlue-script、ClonExpress克隆快线新型质粒等,尽管克隆操作方便。但只能携带小于10kb的外源目的片段。λ噬菌体载体有插入型和替换型两种,其中替换型载体具有20kb装载容量,但是M13噬菌体的装载容量不到1kb,主要用于扩增单链DNA目的片段。黏粒是由正常的质粒与λ噬菌体的cos位点构建而成的人工载体,具有40kb的装载容量。常用的人工为校染色体有YAC和BAC,YAC可以携带800kb甚至1MB的大的DNA片段,而BAC可以携带300kb的DNA片段,所以它们常被用作高等动植物基因组DNA的克隆。
基因工程表达载体是能够使外源目的基因在受体细胞中表达产生基因产物转载体,因此,表达载体除了必须具有克隆载体相同的复制起始位点、选择标记基因和多克隆位点外,还必须具有控制外源基因表达的顺式调控元件和目的基因的完整开放阅读框[open reading frame,ORF]及核糖体结合位点。
目前绝大多数的表达载体是质粒。在原核表达系统中,常用的高效表达系统有诱导表达系统、T7启动子/RNA聚合酶表达系统和融合蛋白表达系统,如GAT融合表达载体、His标签融合表达载体等,酵母的表达载体有甲醇酵母表达系统,外源目的基因在AOX1基因的强启动子下被甲醇诱导高效稳定的表达。哺乳动物的细胞系的表达载体往往是穿梭质粒,既能够在大肠杆菌细胞中繁殖,也能在动物细胞中复制,如pEGFP-N1等,其EGFP标记基因能够与外源基因融合表达,所以常用来检测外源基因的亚细胞定位。

)进行分析,以确保序列中不含有潜在的启动子元件。所有引物均由英潍捷基(上海)贸易有限公司合成。

PCR反应结束后,产物于1%琼脂糖凝胶中电泳后在紫外分析仪中切下目的片段,用胶回收试剂盒回收目的片段,然后以回收的片段为混合模板,lacZ-F2、lacZ-F3和lacZ-R为扩增引物,进行第二轮PCR,再次进行电泳并切胶回收,用Bgl Ⅱ和XbaⅠ对回收目的片段进行双酶切,连入同样经Bgl

1.4 启动子报告载体的构建在质粒pFLX107-lacZ的基础上,通过多克隆位点置换和序列改造构建出一系列基于lacZ基因的启动子报告载体,用于后续筛选。首先,参照Fu等所述方法[]将寡聚核苷酸片段MCS1-F/ MCS1-R和MCS2-F/MCS2-R溶于STE缓冲液中(10 Ⅱ和NdeⅠ间的酶切序列以变性退火的寡聚核苷酸片段MCS6-F/MCS6-R置换构建而成()。

1.5 大肠杆菌MC4100感受态细胞的制备大肠杆菌MC4100感受态细胞的制备参照Sambrook等所述方法进行适应性修改[],具体操作为:用接种环从冻存的大肠杆菌MC4100甘油保存液中沾取少量菌液划线于LB平板,置生化培养箱中37 ℃培养16–24 h,然后用无菌牙签挑取单个菌落,接种于装有5 mL LB液体培养基的试管中,于37 ℃恒温振荡器培养过夜。次日取100 μL细菌培养液于10 mL的LB液体培养基中振荡培养3–4 h,待OD600值达到0.3–0.4时取出培养瓶,分装于1.5 mL离心管中,8 000 r/min离心30 s,弃去上清液,向沉淀中加入500 μL预冷的0.1 mol/L ℃冰箱保存备用。
1.6 启动子报告载体的背景活性测定将上述构建成功的系列启动子报告质粒pFGH01-pFGH06和参考质粒pRCL通过热激转化至大肠杆菌MC4100,再接种至100 mL含氯霉素(35 μg/mL)的LB液体培养基中,分别于28 ℃和37 ℃培养至对数生长期,参照Thongaram等所述方法并略有修改进行β-半乳糖苷酶活性测定[]。具体为:取至少2 mL培养液,6 ℃孵育观察,待呈现足够黄色后,加入0.5 mL 1 mol/L Na2CO3溶液停止反应,再次准确记录加入时间。转移1 mL液体至EP离心管,以最大转速离心5 min以去除细菌残骸和氯仿,测定每管在420 nm和550 nm处的OD值。β-半乳糖苷酶活性以Miller Units (pFGH06)混合并作适当稀释后,分别涂布于仅含有X-gal的LB抗性平板和同时加有X-gal/阿拉伯糖的LB抗性平板,置于28 ℃培养。待长出菌落后,每组用无菌牙签随机挑取10个蓝色菌落,用引物DSeq-F/DSeq-R进行菌液PCR鉴定,并随机送3株阳性克隆至生工生物工程(上海)股份有限公司进行测序验证。
1.9 统计分析采用软件SPSS22.0对所得数据进行统计分析,数据差异采用t检验,P < 0.05和P < 0.01分别作为差异显著和极显著的判定标准。
bp的预期目的片段。然后以回收的片段为混合模板,lacZ-F2、lacZ-F3和lacZ-R为扩增引物,进行第二轮重叠PCR,成功获得3 119 bp含突变位点的lacZ基因及附加序列的全长片段()。最终的测序结果亦显示原lacZ基因中的ClaⅠ、SacⅠ、NdeⅠ酶切位点被成功消除,并且突变序列符合预期。

2.2 启动子报告载体的构建对构建而成的系列启动子报告质粒pFGH01-pFGH06,以DSeq-F和DSeq-R引物进行PCR鉴定,可分别扩增出大小约为328 bp、309 bp、416 bp、397 bp、401 bp和399 bp的预期目的片段,而作为参照的pRCL质粒则未能扩增出片段()。

为消除质粒超螺旋结构对其电泳体积大小的判断,用限制性内切酶Bgl Ⅱ对质粒pFGH01-pFGH06进行单酶切,同时用PstⅠ对质粒pRCL进行单酶切,然后进行电泳,结果显示经Bgl Ⅱ单酶切的线性质粒pFGH01-pFGH06均位于5 000 bp附近,与预期大小(分别为4 878 bp、4 859 bp、4 966 bp、4 947 bp、4 951 bp和4 949 bp,见)相符()。最终所构建质粒的测序结果也均与设计序列一致。

DSeq-R对随机挑取培养的目的克隆进行菌液PCR鉴定,所有克隆均可扩增出预期目的条带,大小分别约为498 bp和1 571 bp (),随机送样测序结果也均符合预期。

讨论β-半乳糖苷酶广泛存在于多种生物中,能水解乳糖为半乳糖和葡萄糖,也具有转移半乳糖苷的作用,可将乳糖转变为异乳糖,而后者是乳糖操纵子的诱导物,在细菌的代谢过程中有着非常重要的作用[]。此外,β-半乳糖苷酶性质稳定,能使多种底物显色,具有多样化的读出过程,且在厌氧环境下仍能发挥功能,这些优点使得其编码基因lacZ自20世纪60年代末被分离以来就成为基因工程实验中的一个常用报告基因[-, ],其中用于启动子的筛选、验证或效能测定等便是其众多应用中非常重要的一个方面。
在实际应用中,为了降低潜在的背景活性干扰,基于lacZ基因的原核启动子报告系统多以低拷贝质粒为骨架构建而成,但由于体积较大,会导致实验操作成本增加并降低对弱启动子的检测灵敏度。为解决上述问题,本研究将pUC型质粒复制子引入到启动子报告系统之中。作为质粒pBR322的衍生体,pUC型质粒的复制子缺乏控制拷贝数的rop基因,同时在复制引物RNAⅡ区域存在点突变,这使得其在大肠杆菌内的拷贝数数倍于亲本质粒,不过降低培养温度可抑制这一表型效应[],这一结论也在本次研究中再次得到证实,以高拷贝质粒pFLX107 (pUC型质粒)为基础构建而成的系列质粒pFGH01-pFGH06在28 ℃培养条件下的背景活性均极显著低于其在37 ℃培养条件下的背景活性。而基于p15A复制子的参考质粒pRCL在这两种温度下的活性大小相近,没有显著差异。值得注意的是,在两种温度下,质粒pFGH01和pFGH02的背景活性均显著高于其衍生质粒pFGH03和pFGH04。鉴于两者在结构上仅相差一个终止子t0,因此对这一现象的可能解释便是,t0的加入有效阻止了多克隆位点前序列中潜在的启动子泄露。
在所构建的pFGH系列质粒中,pFGH06的背景活性显著低于同系列其他质粒,在28 ℃培养条件下甚至显著低于低拷贝参考质粒pRCL的活性。进一步的评估测试显示,质粒pFGH06可用于诱导型启动子和组成型启动子的克隆及活性测定,而且在模拟应用于启动子筛选时,仅通过蓝白斑筛选即可实现对于目标启动子的完全识别。这一切也表明,只要进行合理的序列结构设计,同时改进和完善相关实验方法,pUC型高拷贝质粒亦可用作启动子报告系统。
与已报道的研究相比,本研究中所构建的原核启动子报告系统pFGH06具有以下优点:①pUC型质粒为高拷贝质粒,但由于pUC型质粒复制子的温度相关性,使得其在具体应用时具有一定的灵活性,可根据实验目的进行相应培养温度的调整,从而调节其背景活性;②更小的体积(仅4 949 bp),有利于提高质粒的稳定性和转化效率;③在紧邻报告基因前无启动子区域具有更多的克隆位点,便于序列中含有酶切位点启动子的克隆或筛选;④对原核启动子具有高效的识别效率。这些特点使得其在用于原核启动子的筛选和鉴定时具有更大的适应性,预期具有广泛的应用前景。





我要回帖

更多关于 常见克隆载体 的文章

 

随机推荐