为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 第二讲 基因的现代概念

第二讲 基因的现代概念

2012-09-13 47页 doc 122KB 14阅读

用户头像

is_620394

暂无简介

举报
第二讲 基因的现代概念第二讲 基因的现代概念 吴 乃 虎 中国科学院遗传与发育生物学研究所 2005年8月 目 录 一、移动基因 1.概述 2.插入序列 (1) 插入序列的发现 (2) 原核生物转位因子的类型 (3) 插入序列 3.转位子 (1) 转位子概念 (2) 转位子类别 4.转位作用机理 (1) 转位作用概念 (2) 转位作用类型 (3) 转位作用分子机理 *1.复制型转位 *2.非复制型转位 *3.保存型转位 二、断裂基因 1.断裂基因概念 (1) 定义 (2) 表达程序 ...
第二讲 基因的现代概念
第二讲 基因的现代概念 吴 乃 虎 中国科学院遗传与发育生物学研究所 2005年8月 目 录 一、移动基因 1.概述 2.插入序列 (1) 插入序列的发现 (2) 原核生物转位因子的类型 (3) 插入序列 3.转位子 (1) 转位子概念 (2) 转位子类别 4.转位作用机理 (1) 转位作用概念 (2) 转位作用类型 (3) 转位作用分子机理 *1.复制型转位 *2.非复制型转位 *3.保存型转位 二、断裂基因 1.断裂基因概念 (1) 定义 (2) 达程序 (3) 若干概念 2.间隔子位置的测定 (1) 实验步骤 (2) 异源双链体分子定义 3.mRNA初级转录本的剪辑 (1) 两步机理 (2) mRNA差异剪辑 三、重叠基因 1.重叠基因定义 2.重叠基因的发现 3.原核生物重叠基因类型 (1) 第一种类型 (2) 第二种类型 (3) 第三种类型 4.真核生物重叠基因的类型 (1) 间隔子式重叠基因 (2) 嵌套基因 5.重叠基因的分布 6.重叠基因的意义 四、假基因 1.假基因的定义 2.假基因的拷贝数 3.假基因的类型 (1) 重复的假基因 (2) 加工的假基因 (3) 加工的假基因的起源问题 五、重复序列与重复基因 1.基因家族与基因簇的概念(差异) (1) 基因家族 (2) 基因簇 2.重复序列(基因) 3.重复基因的特点 4.基因拷贝数与其表达量之间的关系 基因的现代概念 一、移动基因 1.概述 *1.移动基因(movable genes),又叫做转位因子(transposable element)。它可以在染色体基因组上移动,甚至在不同染色体分子之间跃迁,所以有时也称之为跳跃基因(jumping genes)。 *2.移动基因最早是由美国冷春港(Cold Spring Habor Laboratory)的女科学家——诺贝尔奖金获得者——B. McClintock于上一世纪40年代,其母校康奈尔大学遗传学系在研究玉米时发现的,当时叫做“控制因子”(controlling elements),或称为激活-解离因子(Activator- Dissociation element, 简称Ac/Ds因子。 *3.玉米中移动基因功能: a.这些控制因子可以插入到玉米染色体的靶子位点上,并抑制与之邻近的其它染色体基因的表达活性; b.控制因子在染色体上没有固定的位置,似乎可以沿着染色体分子移动; c.控制因子在插入染色体之后的适当时间内又可以重新被删除焉,此时原先潜伏基因(dormant gene)的功能也往往得到恢复; d.由于控制因子本身不稳定,因此与之相关的基因也呈现出不稳定状态与高突变率的特性; *4.McClintock工作初期遭遇,与1983年荣获Nobel生物医学奖,获奖后的心态等简介。获Nobel奖后她在给冷春港定量生物学室实验室主任的信中说:请不要打扰我,仍然给我做我想做的工作。 2.插入序列 (1)插入序列的发现 在60年代末期,J. A. Shapiro在研究大肠杆菌高效突变——即可影响一系列功能的突变——时发现,这是由于一种大片段DNA的插入作用造成的,并称这种DNA片段为插入序列(insertion sequences, IS)。 随后的研究发现,除了E.coli之外,在其它的格兰氏阴性和格兰氏阳性细菌中也都广泛地存在着转位因子。 (2)原核生物转位因子的类型: a.插入序列(insertion sequence, IS) 原核生物的转位因子,其分子量小于2000bp的一般叫做插入序列。 b.转位子(transposon, Tn) 有时又叫做转座子(中文译名的差别),系指分子量大于2000bp的转位子。 c.噬菌体型转位子 例如Mu和D108等噬菌体,均属于第三种类型的转位子。 移动基因 Movable genes 转位因子 Transposible elements 跳跃基因 Jumping genes 控制因子 Controlling elements 激活-解离因子 Activator-Dissociation elements 插入序列(IS) Insertion sequence 转位子(Tn) Transposon (3)插入序列 插入序列又叫IS因子,它是在细菌中首先发现的最简单的一类转位因子。其共同特征是: 图2-1 转位子的形体图 (a)简单的转位子,也叫做插入序列,它具有一个控制转位作用的转位酶基因,并往往被反向重复序列,即所谓的IR序列所包围。 (b)复合的转位子Tn 1681,它具有两个插入序列(IS1)和一个热稳定的大肠杆菌素1编码基因。 ①在它们的末端具有一段反向重复序列(但其长度不一定相等,例如IS10转位因子的左边IR序列是17bp, 右边是22bp); ②当IS因子插入到靶位点之后,便会在其两端的外侧产生一段短的同向重复序列; ③IS因子一般只编码一种参与转位子作用的转位酶(transposase),它能够识别反向重复序列,并催化转位因子发生删除作用,从染色体上游离出来。 图2-2 IS因子转位作用形成同向重复序列的原理 (a)具有IS因子插入靶子位点的一段DNA分子; (b)在靶子位点形成交错的缺口; (c)IS因子同缺口位置的单链末端连接; (d)在靶子位点出现的裂口被补齐并封闭,形成短小的同向重复序列序列。 ④IS因子能够四处活动,几乎可以插入到大肠杆菌染色体的各个位置上;也可以插入到质粒和某些噬菌体基因组上;甚至可以插入到同一个基因的不同位点上; ⑤IS因子的插入作用可以正向也可以反向整合到基因组上。我们特称IS因子的这种移动方式为转位作用(transposition)。转位作用 表2-1 若干种大肠杆菌IS因子的基本参数 名称 分子大小 (bp) 反向重复序列 (bp) 靶子位点的同向 重复序列(bp) 靶子位点选择 IS1 768 23 9 随机 IS2 1327 41 5 热点 IS4 1428 18 11或12 AAAN20TTT IS5 1195 16 4 热点 IS10R 1329 22 9 NGCTNGCN IS50R 1531 9 9 热点 IS903 1057 18 9 未知 3.转位子(transposon) (1)转位子概念 转位子又叫转位因子(transposable element)或转座子,其英文定义: A segment of DNA that can move from one position in the genome to another. Transposon is a DNA sequence able to replicate and insert one copy at a new location in the genome. 转位子(transposon)是在许多细菌中发现的另一类移动单元,它是由几个基因组成的特定的DNA片段,而且往往带有抗菌素抗性基因。例如氨苄青霉素转位子就是其中一例。 (2)转位子类别 根据结构特征,转位子可以分为复合系和Tn3系两种不同的类别: a.复合转位子(Complex transposone) 复合转位子是由2个同样的IS因子连接在抗菌素抗性片段的两侧构成的。 复合转位子很容易携带着抗菌素抗性基因从细菌染色体转移到质粒或噬菌体基因组上。当发生这种情况时,转位子就会迅速地传播到其它细菌中去,这类转位作用是自然界中发生细菌抗药性的主要原因。 b.Tn3转位子 Tn3转位子结构比较复杂,长度约为5000bp,末端有一对38bp的IR序列,但不含有IS因子序列,每个Tn3均由3个基因组成: ①AmpR基因 编码(-内酰氨酶,提供氨苄青霉素的抗性。 2 TnpA基因 编码1种长度为1015氨基酸的转位酶:它作用于转位子末端产生双键切割,使转位子从给体分子上删除下来;并在靶子位点作交错切割,使转位子插入进去。 3 TnpR基因 编码一种185个氨基酸的蛋白质。其功能有二:抑制TnpA基因合成活性;促进中间分解区又称中央解离位点res (resolution site)发生位点特异的切割; 表2-2 若干种大肠杆菌复合转位子的基本参数 名 称 分子大小(bp) 遗传记号 末端组件 组件取向 组件关系 Tn903 3100 KanR IS903 反向 同样 Tn9 2500 CanR IS1 同向 可能同样 Tn10 9300 TerR IS10R IS10L 反向 2.5%差异 Tn5 5700 KanR IS50R IS50L 反向 1bp差异 4.转位作用机理 (1)转位作用概念 *1.转位作用定义: The movement of a gene or set of genes from one site in the genome to another. 移动基因的分子本质是一段能够插入到寄主基因组新位点的特异的DNA序列结构。 *2.转位作用特点: a.是一种与recA基因无关的新的重组类型,其唯一结果是转位因子的转动; recA gene=重组作用基因 b.转位因子插入位点是一段与之没有同源关系的核苷酸序列; c.转位过程涉及到DNA复制; *3.转位作用步骤: 第一步,在靶DNA上造成交错的断裂; 第二步,转位子连接到靶DNA的突出的(延伸的)单链末端; 第三步,连接留下的缺口(gap)的补齐与封闭 (2)转位作用类型 科学工作者对转位作用的机理认识经历了由肯定——否定——再肯定的反复过程,由表入深的过程,逐步深化的过程: *早期的研究工作认为转位子可以从一个位点转移或移位到另一个位点,故将此过程称为转位作用。 *随后发现这种命名是错误的,因为在转位过程中,转位因子的一个拷贝仍留在原来的位点上,同时在新的位点出现第二个拷贝。因此转位与重组不同,转位过程必须进行DNA复制。进一步说,这种重组的唯一可能的后果是转位因子的移动。 *最近(B. Lewin, 1994)根据最新研究进展表明,事实上转位作用有如下三种不同的类型: a. 保存型转位(Conservative transposition) b. 复制型转位(Replicative transposition) c. 非复制型转位(Nonreplicative transposition) 有些转位子仅能按照其中的一种机理发生转位,而有些转位子则可按照两种机现进行转位,例如IS1和IS903就可按复制型和非复制型两种机理转位,而噬菌体Mu则可按任何一种机理转位。 图2-3 由交错切割形成的正向重复的靶DNA序列包翼在转位子的两侧,其延伸的末端同转位子连接。(A)在靶子位点发生交错切割;(B)转位子同单链末端连接;(C)补齐和封闭靶子位点的裂口。(From. B. Lewin P.1006) (3)转位作用的分子机理 A.复制型转位 在复制型转位过程中,转位子发生复制,因此被转移的实体是一份原本的转位子。 其中一份拷贝仍保留在原来的位置,而另一份拷贝则插入到基因组的新位点。因此,这种类型的转位作用是通过增加转位子的拷贝数得以实现的。Tn3转位子的转位作用便属于此种类型。 *1.复制型转位的酶催活性 复制型转位过程中涉及两种酶催活性,下面以Tn3转位子为例予以说明。 图2-4 复制型转位产生的一个转位子拷贝插入到一个受体位点上。给体位点保持不变。因此,复制转位的结果是给体与受体各具有一个转位子拷贝。 图2-5 非复制型转位中,转位子以一个物理实体从给体位点转移并插入到一个受体位点。这样转移的结果使给体位点断裂,若不被修复,就将基因组造成致死效应。 a.Tn3转位子编码的转位酶(Transposase)——作用于转位子的末端,产生双链切割,使转位子从给体分子上删除下去;并在靶子位点作交错切割,使转位子插入进去。 转位酶由tnpA基因编码 b.Tn3转位子编码的另一种酶是解离酶(Resolvase)——此种酶具有如下两重功能: ①作为阻抑物,抑制TnpA基因表达。 ②解离酶功能,促使共合体结构中两个以同向重复形式存在的转位子之间发生位点特异的重组。 解离酶由tnpR基因编码 cointegrate共同体 图2-6 TnA转位子具有一对末端反向重复序列(IR),一个中央位置的res位点和3个基因。Res:site of resolution, 即解离位点。 tnpA基因编码产物是一种转位酶,它同长度为38bp的末端反向重复序列中的一段约25bp的序列结合。我们相信转位酶可①识别转位子的末端,而且同样能够在供转位子插入的②靶DNA位点造成(形成)交错的具5bp延伸序列的断裂。 tnpR基因编码产物是一种具有双功能的蛋白质。它一方面可以起到阻抑物的作用,抑制tnpA基因和自身基因(tnpR)的表达活性;另一方面又可起到解离酶的功能作用(resolvase, 解离酶)。 *解离酶的功用是促进中央分解区发生位点特异的切割作用。 DNA-protein复合物的foot printing试验证明,TnpR解离酶是结合在res分解区,如图2-6所示,解离酶在分解区(res)中有3个各长30-40bp的结合位点,它们是彼此独立地同解离酶发生结合作用。这3个结合位点共有一段二重对称(dyad symmetry)的同源保守序列。 所谓二重对称:系指旋转180°后产生相同结构的对称体,它是用来描述双螺旋DNA分子中含有回文对称的区域。这种区域旋转180°后得到相同的碱基序列。 tnpR基因的突变导致转位频率上升,其原因是TnpR蛋白质抑制了tnpA和tnpR两个基因的转录活性。因此,TnpR蛋白质的失活作用就会使TnpA蛋白质的合成活性上升,从而最终导致转位频率的增加。这意味着:TnpA转位酶是转位作用的一种限制因子。这一点无疑是很有用处的。 res分解区(或叫解离位点)的功能鉴定: 应用顺式作用缺失(cis-acting deletion)法,证明当res区缺失时,转位作用便被完全阻断了,并导致共合体的累积。 在res缺失的情况下,解离反应可以被以RecA介导的一般重组所取代,但其效果必定的低效的。 *2.复制型转位反应阶段: 复制型转位过程(图2-7)包括如下两个阶段: a.第一阶段,含有转位子的一个复制子(replicon)同没有转位子的另一个复制子融合起来,这种由复制子融合而成的结构叫做共合体(cointegrate)。在这样形成的共合体中含有两份相同的转位子的拷贝,它们按同向重复的方式排列并彼此结合成一体。 何谓复制子(Replicon): 所谓复制子乃是含有一个复制起始位点的基因组中的DNA复制单位(Replicon is a unit of the genome in which DNA is replicated; contains an origin for initiation of replication.)例如细菌染色体、病毒基因组、质粒基因组等,其DNA能够进行自主复制的遗传单元,均称为复制子,每一个复制子都含有一个启动复制的起点。真核细胞、染色体内的“复制子”称为复制单位。 b.第二阶段,两个拷贝的转位子之间发生同源重组,能够再生(regenerate)出原来的给体复制子,并释放出一个靶复制子(target replican)。 此种靶复制子已经获得了一个转位子,其两侧由寄主靶序列的短同向重复序列包围。 解离:这种通过两个拷贝的转位子之间的重组形成一个原给体复制子和一个靶复制子的反应叫做解离(resolution),它是由解离酶催化的。 解离反应释放出两个各含有1份同样转位子拷贝的复制子个体(图2-7)。 *3.共合体结构的形成 我们以Mu噬菌体为例说明共合体结构(cointegrate structure)形成的过程: 图2-7 转位作用能把一个给体复制子与一个受体复制子融合成一个共合体。解离作用释放出两个复制子,它们各含有一份转位子拷贝。 Mu转位酶(transposase),是一种能够识别末端的位点特异的核酸酶,它从转位子两端单链切割给体分子; 同时转位酶在受体分子的靶位点作交错的单链切割形成5个碱基的单链延伸末端。 ↓ 给体分子与受体分子在缺口部位连接: 转位子序列的每一端都与靶子位点上的一条单链延伸末端连接,形成一种交叉结构(crossover structure)它含有一对转位子。 ↓ 图2-8 Mu噬菌体的转位作用产生出一种交叉结构,它经过复制转变成一个共合体。(A)缺口形成。单链切割在转位子和靶位点形成交错末端。(B)交叉结构形成。转位子缺口末端与靶位点缺口末端连接。(C)共合体。一个分子的共合体具有两个拷贝的转位子。(D)共合体分子拉长,表明转位子是位于复制子间的接合部。 ↓ 交叉结构在每一个交错末端(staggered ends)都具有一个单链区。这些单链区是一种假复制叉(pseudoreplication forks),供作DNA合成的模板。(使用这种延伸末端作引物进行复制,意味着必定会发生链的极性断裂在此位点产生一个3(-OH末端)。 如果从两个复制叉继续进行复制,就将会通过转位子按两链分开形式进行复制,并终止在该链的末端。(From Lewin P.1011)(此种复制可能是由寄主编码的功能完成的),此时,交叉结构便变成为一种共合体(cointegrate)——在其上的两个复制子之间的交接处有两个同向重复排列的转位子。 何谓共合体(cointegrate)? 共合体是指由一个具一个转位子的复制子同另一个不具转位子的复制子融合而成的结构,在共合体的两个复制子结合部位具一对同向复制排列的转位子拷贝。 B.非复制型转位 在非复制转位(nonreplicative transposition)中,转位子是以一种物理实体(physical entity)直接从基因组的一个位点转移到另一个位点,并因此得以保存。 非复制转位按两种不同的机理进行。 *1.以Mu噬菌体为例,它的非复制转位是通过给体DNA与靶DNA之间的连接作用实现的。 IS因子、复合转位子Tn10和Tn5均按此种机理转位(见图1-3),它涉及转位子在转移过程从给体DNA删除下来。 此种转位机理仅涉及转位酶 非复制型转位过程中删除下来的转位子,插入到靶子位点上,而在给体位点(donor site)留下空位。那么在非复制转位之后,给体分子将会发生什么变化呢?有两种可能性: ①一种可能性是此种给体DNA因此被破坏掉。由于细菌染色体具有一个以上的拷贝(多拷贝),因此它是能够忍受此种破坏的。 ②另一种可能性是,寄主的修复体系能够识别这种双链断裂,并予以修复(repair sestems)。 *2.非复制转位的另一种机理特称为保存型转位(Conservative transposition)(见下节) C.保存型转位 正如上节我们已经提到的,保存型转位是属于另一种类型的非复制型转位。Tn10转位子就是按此种机理进行转位的。 当发生保存型转位时,在转位子编码的转位酶作用下,转位子的末端发生双链切割后便从给体DNA分子上删除下来,而后也是在转位酶的作用下,靶子位点发生交错的切割,以使转位子插入进去(图2-9)。 图2-9 保存型转位。与(噬菌体的整合与删除作用相比,在按保存型机理进行的转位子转位过程中不丧失任何核苷酸键。 在保存型转位过程所涉及到的一系列事件中,每一个核苷酸键(nucleotide bond)都被保存下来。这个过程同(噬菌体的整合过程(integration)的机理是十分类似的。就连所涉及的转位酶也与(整合酶(integrase)有亲缘关系。 表2-3 复制型转位与非复制型转位的比较 复制型转位 非复制型转位 发生复制 不发生复制 形成共合体 不形成共合体 给体中保留转位子 给体中不留转位子 形成交叉结构 形成交叉结构 二、断裂基因 1.断裂基因概念 (1)定义 真核蛋白质编码基因的序列结构分析发现,在它们的核苷酸序列中间插入有与氨基酸编码无关的DNA间隔区,使一个基因分隔成不连续的若干区段。 我们称这种编码序列不连续的间断基因为断裂基因(split gene)。 (2)表达程序 断裂基因 DNA 转录,帽的形成 polyA尾巴的加入 (tailing) 初级转录物——核内不均一RNA (hn RNA),即前体mRNA 发生删除与拚接 成熟的mRNA 从细胞核进入细胞质 蛋白质多肽链 (3)若干概念 *1.间隔子 在mRNA成熟加工过程中,其转录物被剪除掉的DNA部分叫间隔序列(intervening sequence)。或间隔子(introns)…间隔子 *2.表达子 被保留下来的DNA部分叫编码序列(coding sequence)或表达子(exons)……………………………………………表达子 *3.RNA剪辑 这种间隔子的删除和表达子的连接形成最后成熟mRNA的过程叫做RNA剪辑(RNA splicing) ………………RNA剪辑 2.间隔子位置的测定 应用S1核酸酶作图法,可以测出在断裂基因中的间隔子的位置。 (1)实验步骤 提取细胞总RNA 同含有一个间隔子的克隆的DNA片段进行核酸杂交 形成异源双链体分子(hetroduplex) 基因的间隔子序列由于没有相应的转录序列,而无法同mRNA分子杂交,因此形成单链的环状结构(DNA-RNA杂种分子)。 用S1核酸酶处理,使单链的DNA环状结构被降解成单核苷酸,于是DNA片段被分解成两个片段。 凝胶电泳,测定这两个片段的分子量大小。 间隔子位置推算(参见《基因工程原理》第3章有关) (2)异源双链体分子定义 同一条双链DNA分子中的两条链分别来自两种不同的个体,如一种是野生型的一种是突变型的,因此在这样的双链DNA分子结构中,有一些甚至是大量的碱基是不能配对的,而形成单链的环状结构。 3.mRNA初级转录本的剪辑 (1)两步机理(two-stop mechanism)剪辑法 绝大多数真核生物基因的mRNA前体(pre-mRNA),有时也叫做核内不均一RNA(hn RNA)(heterogeneons nuclear RNA),都含有许多间隔子,它们需要在mRNA穿过核膜进入细胞质进行转译之前,通过一种叫做两步机理的剪辑作用而被删除掉。 *1.剪辑体(spliceosome):这是发生mRNA剪辑作用的一种特殊的高分子量的颗粒。它含有: pre-mRNA 高密度的核内小核糖核蛋白(small nuclear ribonucleoprotein, snRNP)颗粒 各种剪辑因子 第一步,在剪辑位点(splice site)发生切割反应 第二步,涉及3(剪辑位点的切割及表达子的连接。 *2.剪辑位点 真核细胞mRNA的5(及3(的剪辑位点的保守序列。几乎所有的间隔子序列都是以G-U开始,用A-G结束的。根据对许多表达子-间隔子边界序列的分析,已经得出了5(末端和3(末端的优选的保守的核苷酸序列,除了A-G之外,紧挨3(剪辑位点上游序列的其它核苷酸,对于进行精确的剪辑作用,同样也是十分重要的。 在间隔子的两端总是具有5(GU和3(AG的二核苷酸结构。 这种特异性的二核苷酸连同围绕它们的25-30个核苷酸一起构成了表达子-间隔子剪辑位点。 剪辑位点也叫做剪辑点(splice junction),它是启始RNA剪辑作用的一段特定的核苷酸序列。 *3.套索RNA 套索RNA(lariat RNA):因剪辑作用而被删除下来的间隔子形成的一种分支状中间体,称为套索RNA。 (2)mRNA的差异剪辑(differential splicing) *1.定义 有些基因的初级转录本,在不同的细胞类型中或是在发育的不同阶段,可以按不同的途径剪辑形成不同的RNA分子,编码不同的蛋白质,我们称这种现象为mRNA的差异剪辑(differential splicing)或可变剪辑(alternative splicing)——可变剪辑 同一种蛋白质的mRNA前体,经过可变剪辑之后,往往会产生出不同形式的蛋白质,即蛋白质的异型体,以满足生物体的不同发育阶段或不同细胞类型的特殊需要,因此剪辑在发育过程中起到一种开关的作用。 有关可变剪辑的机理,目前尚不知道。已经提出一种模型认为存在特殊的剪辑因子(splicing factor)来指导优先使用一组特殊的表达子组合。 图2-10 在两种不同器官中发生的可变剪辑途径 在两种不同的器官中发生的可变剪辑,结果从同一种初级转录本产生出两种不同的转译产物,一种是降钙素肽,另一种是降钙素基因相关肽(CGRP=calcitonin-gene-related peptide),降钙素肽和降钙素基因相关肽是两种相关的激素。CT=降钙素(calcitonin)。 三、重叠基因(Overlapping genes) 1.定义: 核苷酸编码序列彼此重叠的、编不同蛋白质的两个或数个基因,称为重叠基因,又叫做嵌套基因(nested genes)。它最早是在大肠杆菌噬菌体中发现的,后来在真核细胞中也发现有此类基因。 2.重叠基因的发现: 已知大肠杆菌细胞中的(X174噬菌体单链DNA=5386个核苷酸。 *1.5386/3=1795个氨基酸。因此它最多只能编码总数1795个氨基酸 *2.氨基酸平均分子量MW=110 1795×110=197000 *3.实际测得的(X174噬菌体编码的十一种蛋白质的分子量共为266000 根据上述分析,F, Sanger在测定了(X174 DNA的核苷酸序列之后发现,它的同一部分DNA能够编码两种不同的蛋白质,从而发现了重叠基因。 3.原核生物重叠基因类型: (1) 第一种类型:一个基因的核苷酸序列完全包含在另一个基因的核苷酸序列当中,只是由于读码结构不同,因此编码着不同的蛋白质产物。 (2) 第二种类型:两个基因核苷酸序列的末端密码子相互重叠。例如A基因的终止密码子的3个核苷酸TGA与C基因的起始密码子ATG重叠了二个核苷酸: A基因终止密码子 ——A——T——G——A—— C基因起始密码子 (3)第三种类型:在G4噬菌体中发现此类重叠基因重叠的核苷酸区段(由4个或5个核苷酸组成)同时为3个不同的基因编码,重叠部分的核苷酸序列是TGATG,编码K、A、B三个基因: 基因B → 苯丙氨酸 — 终止密码子 基因A → 丝氨酸 — 天冬氨酸 — 谷氨酸 — T — T — C — T — G — A — T —G — A — A — A — G4 DN序列 基因K → 甲硫氨酸 — 赖氨酸 (起始密码子) 4.真核生物重叠基因类型 现在已经知道不仅在原核生物中存在着重叠基因,而且在真核生物中也发现有重叠基因。 (1) 间隔子式重叠基因:一个基因的编码序列完全寓居于别个基因的间隔子序列当中。 例如在果蝇的GART基因(这是一种编码嘌呤生物合成的重要酶蛋白的基因)的一个间隔子序列中,寓居着一个与之无关的编码蛹角质膜蛋白的基因,但两者转录方向相反。 (2)嵌套基因:这是在高等真核生物中发现的另一类重叠基因,其特征是以基因的相反链编码。 例如从人类基因组中克隆的一种编码819个氨基酸蛋白质的基因cDNA片段,其相反链(opposite strand)上还编码一个类固醇21-羟化酶基因。 5.重叠基因的分布 *1.目前已经在(X174噬菌体、G40噬菌体、SV40病毒以及少数的真核基因中,发现了重叠基因的存在。然而重叠基因在生物界中是否普遍存在?目前尚无法肯定。 *2.但是我们相信,随着研究工作的不断深入,尤其是有关间隔子序列的测序和功能鉴定的深入,人们完全有可能发现另外的新型的重叠基因,也就是有关重叠基因的数量以及类型,都将会有不断定发展。 6.意义: 重叠基因的发现,修正了关于基因间核苷酸序列互不重叠的概念! 四、假基因 目前已经在大多数真核生物中,都找到了其核苷酸序列同相应的(正常的)功能基因相比,大部分都是同源的,但却是无活性的不能转录的基因,即假基因(Pseudogenes)。 1. 假基因的定义: 一类同野生型基因序列大部分同源,但由于突变而失去活性的畸变的核苷酸序列。假基因可能是一种活性基因在进化过程中保留下来的遗迹,它虽不能表达,但却是基因组的稳定成份。 2. 假基因的拷贝数 (1)已知小分子量的polⅢ和polⅡ RNA基因,通常有数百个假基因。 (a)例如U1 snRNA(small nuclear RNA)大约有50~100个功能基因,但却有500~1000个范围的假基因,后者为前者的10倍; (b)再如,哺乳动物的7SL RNA基因族,只有4个活性基因,却拥有数百个的假基因,超过前者的数十倍乃至百多倍。 (2)在蛋白质的编码基因中,假基因的拷贝数的数量则是比较低的,通常不会超过20个。 3.假基因的类型 (1)重复的假基因 *许多假基因都是同“亲本基因”(parental gene)连锁的,而且同其编码区及侧翼序列的DNA具有很高的同源性。 *鉴于产生此类假基因拷贝的一种可能的机理是,由含有“亲本基因”染色体区段串联重复形成,故称之为重复的假基因(Repeat pseudogene)。 *一般认为在起初这种重复的基因是有功能的,但在进化的过程中,其中某一个基因发生独立的突变而丧失了功能,出现了进货的盲端,最终形成了假基因。 *例如(-珠蛋白座位具有5个基因中,有两个是假基因,这两个假基因虽然没有功能活性,但却能稳定遗传: E1——胚胎珠蛋白基因 A1和A2——成体珠蛋白基因 (E1和(A1——假基因 图2-11 位于16号染色体上的人(-珠蛋白基因座 在上图所示的这5个基因中,(A1显然是A1基因的重复或者说是复制品(duplication),两者之间有73%的同源性,都含有间隔子及保守的5(控制元件,而且它们在5(及3(侧翼DNA之间都具很高的同源性。 但由于(A1基因中发生了许多突变而失去功能活性,故成假基因,该基因((A1)很可能是在45百万年以前由野生型基因突变形成的。 (2)加工的假基因 *1.概念 研究发现在真核生物染色体基因组中,除了重复的假基因之外,还存在着另外一类“加工的假基因”(processed pseudogene)。由于这类假基因没有与“亲本基因”连锁,而且其结构是同转录本而非“亲本基因”类似。例如: a. 没有启动子结构, b. 没有间隔子序列, c. 在基因的3(-末端都有一段延伸的腺嘌呤短序列,恰似mRNA分子3(-末端的poly(A)尾巴。 这些特征表明,此类假基因很可能是来自加工的RNA之DNA拷贝,因此,称之为加工的假基因。 图2-12 人金属硫蛋白功能基因Mt-ⅡA与无功能的加工的假基因Mt-ⅡB的结构比较 *2.加工假基因的结构特点 人金属硫蛋白基因Mt-ⅡA的无功能复本Mt-ⅡB,是一种典型的加工的假基因。从图2-12可以看到,这个假基因显然是功能基因Mt-ⅡA mRNA的准确复本(或称Copy),其结构特点是:①它准确地从帽位点开始, ②失去了间隔子, ③终止在poly(A)位点。正是根据这些结构特征,我们有理由相信Mt-ⅡB是来自金属硫蛋白基因Mt-ⅡA之加工的mRNA的DNA拷贝。所以说它是一种典型的加工的假基因。 *3.金属硫蛋白加工的假基因Mt-ⅡB失活的原因分析: a. 可能是因为它失去了转录控制信号,因此没法进行正常的转录,亦即是失去了转录活性; b. 可能是由于在编码区出现了一个终止密码子,因而使该基因失活。所以即便在5(端加上一个功能的启动子(即转录控制信号),具此类似结构的加工假基因也仍然是没有活性的。 (3)加工的假基因的起源问题——细胞质mRNA反转录作用 无间隔子假基因形成的分子机理: *1.如上所述,第二类假基因的许多特征表明,它们是来自加工的mRNA之DNA拷贝,因此被称之为加工的假基因。 *2.此外,加工的假基因的两侧,通常还包翼着5~30bp的短同向重复序列(directly repeated sequence),而且这些重复序列DNA同其亲本基因完全没有关系。 *3.加工假基因的形成,很可能是同反转录酶有关,这种酶可以RNA为模板形成DNA拷贝,然后以双链DNA形式插入到基因组。 *4.这涉及到形成一种起始的靶子断裂,这种断裂在插入过程中被修复产生出一种短同向重复序列(如同在加工基因中所见到的短同向重复序列)。 *5.事实上加工基因是反转录酶产生的,而且表面上这种加工基因可以随机地插入到染色体的各个部位,因此被叫做逆转位子(retroposons)。如此插入的结果便产生出无间隔子的假基因(图2-13)。 *6.在真核生物基因组中,假基因的现象可能是相当普遍的,有人估计在真核基因组(例如人类)可能有1/4是没有活性的假基因。 图2-13 细胞质mRNA反转录作用形成无间隔子的假基因 在高等生物的染色体中存在着一系列的假基因,这个事实使人们猜想这些剪辑的DNA(spliced DNA)拷贝可能是由胞质mRNA反转录产生的。而这种反转录作用大概是发生在一种流产的反转录病毒感染期间。随后,剪辑的基因通过一种目前尚不了解的机理而重新插入到染色体DNA上。 五、重复序列与重复基因 1.基因家族与基因簇的概念(差异) (1)基因家族(gene family)(结构、产物、功能三相似) 系指同一种生物中,从同一祖先基因经过复制、突变而来的一组具有相似结构、相似产物及相似功能的基因群体。从广义上讲,同一个基因家族的各个成员也可以看作是重复基因,但它们的序列差异毕竟比较大,也就是说同源性还是较低的。 (2)基因簇(gene cluster)(不同基因间的一种特殊的组合排列方式) 系指真核生物基因组中,由不同基因组成的一个特殊的组合排列方式。同一基因簇的各个基因在遗传上往往是紧密连锁的,它们可以是属于同一个操纵子的不同结构基因,也可以是属于不同操纵子的不同结构基因;它们可以是来自同一基因家族的不同成员,也可以是来自不同基因家族的不同成员。 2.重复序列(基因) *研究表明,在几乎所有的真核生物(低等真核生物酵母除外)的基因组DNA中,都存在有重复序列(Repeated sequence)。常见的重复序列或说是重复基因有: a.组蛋白基因, b.rRNA基因 c.tRNA基因等 *在真核生物基因组中有4种不同类型的DNA序列(排列方式): (i)不重复的唯一序列(只有一个拷贝的基因序列,由于通常研究的细胞是二倍体,所谓不重复的唯一序列,实际上存在着两个拷贝)。 (ii)低度重复序列(1~10拷贝) (iii)中度重复序列(10~数百个拷贝) (iv)高度重复序列(数百个拷贝以上,多的可达数千上万个拷贝,甚至百万份以上) 3.重复基因的特点(注意与基因家族间的差异) 下面介绍串联重复基因的特点 *1.各成员之间具有高度的序列一致性,甚至完全相同,不像基因家族中各成员差异较大; *2.拷贝数常有几十个甚至数百个,其数量远远超过基因家族的成员数; *3.非转录的间隔子区短而一致,不像基因家族各成员之间的非转录间隔区长短不一; 4.基因拷贝数与其表达量之间的关系 *1.生物体以rRNA基因和组蛋白基因这种多拷贝数形式来增加基因的剂量,提高蛋白质的合成速率,可能是一种特例,而非普遍的模式。 *2.因为许多重要的蛋白质,都是由单拷贝基因编码的,例如丝心蛋白基因是单拷贝的,但它可合成104个mRNA分子,而每个mRNA分子又可合成105个蛋白质多肽。因此4天之内,一个单拷贝的丝心蛋白基因便可合成出总数为104×105=109个蛋白质分子,其数量足以满足生命需求。 104mRNA分子×105蛋白质分子 ↓ 109蛋白质分子 PAGE 47
/
本文档为【第二讲 基因的现代概念】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索