随着人类基因组计划的完成,蛋白表达技术已渗透到生命科学研究的各个领域。越来越多的基因被发现,其中多数基因功能不明,利用蛋白表达系统表达目的基因是研究基因功能及其相互作用的重要手段。根据不同的表达要求,如表达量高低、目标蛋白的活性和表达产物的纯化方法,可选用适当的表达系统及相应的表达策略。
分类
蛋白表达是现代工业、医疗和基础研究领域的重要组成部分,也是当前生物技术的难点和热点,重组蛋白表达的系统主要分为:
(1)原核蛋白表达系统
以大肠杆菌表达系统为代表,具有遗传背景清楚、成本低、表达量高和表达产物分离纯化相对简单等优点,缺点主要是蛋白质翻译后缺乏加工机制,如二硫键的形成、蛋白糖基化和正确折叠,得到具有生物活性的蛋白的几率较小。
(2)酵母蛋白表达系统
以甲醇酵母为代表,具有表达量高,可诱导,糖基化机制接近高等真核生物,分泌蛋白易纯化,易实现高密发酵等优点。缺点为部分蛋白产物易降解,表达量不可控。
(3)哺乳动物细胞和昆虫细胞表达系统
主要优点是蛋白翻译后加工机制最接近体内的天然形式,最容易保留生物活性,缺点是表达量通常较低,稳定细胞系建立技术难度大,生产成本高。
异源蛋白质在细菌中表达是目前使用的主要的蛋白生产系统。大肠杆菌一直是最经济的系统之一。然而为了生产需要特异修饰、胞外分泌或有特异折叠需要的蛋白质,其他表达系统也是需要的。
密码子偏爱性
原核细胞表达真核基因的cDNA时,会涉及到密码子的偏爱性,真核细胞在表达原核来源的基因、真核基因的cDNA拷贝或其他无内含子的基因时可能表现很多特异问题。富含AT的基因在很多真核细胞中表达时会遭遇很剧烈的障碍。主要的真核信号序列如加poly-A的位点、酵母转录终止位点和真核mRNA去稳定序列都是富含AT的。内含子序列也趋向于富含AT,尽管他们有参与剪切过程的很特异的识别序列。虽然绝大多数原核基因没有剪切或聚腺苷过程,但这些真核过程需要的保守序列可能存在于原核基因中,因此当这些基因在真核细胞中表达时可能引起特异的问题。而且诸如哺乳动物和单子叶植物细胞的特异真核表达系统可能不能有效地表达无内含子的基因。
处理和修饰
真核mRNA在离开细胞核进而在胞浆的核糖体上被翻译前需要特异的处理和修饰。这些过程包括去除内含子、5'端甲基化帽子形成和3'端加poly-A。内含子去除需要5'剪切位点、G75/G100U100A65AG65U保守序列、3'剪切位点、富含密啶NC66A100G100/G56保守序列和C72T98R77A100Y75保守序列。有效的加poly-A和mRNA剪切需要一个由两个部分组成的信号:加poly-A保守序列AAUAAA和在切割位点内的50个碱基的富含GT的序列。酵母真核转录终止序列(几个不同的富含AT序列,如含TTTTTATA,TATATA,TACATA,TAGTAGTA的一个38bp区域)被研究的最清楚。这些结果来自对酵母突变体CYCI mRNA的mRNA水平和相对长度的确定的实验。近期用in vivo质粒稳定性分析的研究结果证明:TATATA似乎和原始的38bp野生型区域一样有效地终止转录,而TAGATATATATGTAA和TACATA效率差些,TTTTTTTATA几乎没有效率。所有这些序列在反方向时没有终止转录功能。不幸的是几乎没有其他真核表达系统转录终止序列方面的信息。
内含子对几个哺乳动物基因的正常表达是必需的,包括Beta-球蛋白、SV40 late mRNA和二氢叶酸还原酶基因。单子叶植物细胞充分表达乙醇脱氢酶的cDNA拷贝、报告基因氯霉素乙酰转移酶、Beta葡萄糖苷酸酶和其他缺乏内含子的基因时也依赖内含子。转录区域内引入内含子可以通过未确定的转录后机制增强表达。(免疫球蛋白基因)内含子可能也包含转录增强子,因此通过转录机制增强表达。