null第二章 基因与基因组的结构和功能第二章 基因与基因组的结构和功能第一节 基因的细胞与遗传学基础第一节 基因的细胞与遗传学基础细胞是生命活动的基本单位
细胞是生命活动的基本单位
细胞构成有机体的基本单位
细胞是代谢与功能的基本单位
细胞是有机体生长发育的基础
细胞是遗传的基本单位,具有遗传的全能性
没有细胞就没有完整的生命细胞的基本共性
细胞的基本共性
所有的细胞表面均有由磷脂双分子层与镶嵌蛋白质构成的生物膜,即细胞膜。
所有的细胞都含有两种核酸:即DNA与RNA作为遗传信息复制与转录的载体。
作为蛋白质合成的机器─核糖体,毫无例外地存在于一切细胞内。
所有细胞的增殖都以一分为二的方式进行分裂。 null核仁粗面内质网染色质核糖体高尔基体微管中心体溶酶体线粒体过氧化物酶体null氨基酸肽链较成熟蛋白质成熟蛋白质内质网的核糖体内质网高尔基体细胞膜线粒体囊泡囊泡合成 盘旋、折叠、
糖基化、运输加工、修饰、分泌分泌分泌蛋白null核糖体内质网高尔基体细胞膜合成肽链运输
糖基化
折叠
盘旋运输
包装
加工外排作用分泌蛋白的合成与运输线粒体各种生物膜在功能上既有明确的分工,又有紧密的联系。null染色体是基因的载体染色体是基因的载体 细胞内的三大系统
生物膜系统
细胞骨架系统
遗传信息表达结构系统细胞核的结构组成:
核被膜(nuclear envelope)与核孔复合体(NPC)
染色质(chromatin)
核仁(nucleolus)
核基质 核仁(necleolus)核仁(necleolus)见于间期的细胞核内,呈圆球形,一般1-2个,也有多达3-5个的。核仁的位置不固定,或位于核中央,或靠近内核膜,核仁的数量和大小因细胞种类和功能而异。
核仁组成成分包括rRNA,rDNA和核糖核蛋白。核仁是rRNA基因存储,rRNA合成加工以及核糖体亚单位的装配场所。
染色质概念染色质概念染色质(chromatin):
指间期细胞核内由DNA、组蛋白、非组蛋白及少量RNA组成的线性复合结构, 是间期细胞遗传物质存在的形式。
染色体(chromosome):
指细胞在有丝分裂或减数分裂过程中, 由染色质聚缩而成的棒状结构。
染色质与染色体是在细胞周期不同的功能阶段可以相互转变的的形态结构
染色质与染色体具有基本相同的化学组成,但包装程度不同,构象不同。
常染色质和异染色质常染色质和异染色质常染色质(euchromatin)
指间期核内染色质纤维折叠压缩程度低, 处于伸展状态(典型包装率750倍), 用碱性染料染色时着色浅的那些染色质。
常染色质是进行活跃转录的部位,呈疏松的环状,电镜下表现为浅染。并非所有基因都具有转录活性,常染色质状态只是基因转录的必要条件而非充分条件
异染色质(heterochromatin):
指间期细胞核中, 折叠压缩程度高, 处于聚缩状态,碱性染料染色时着色较深的染色质组分。染色体的一般形态染色体的一般形态一条染色体的两个染色单体互称为姊妹染色单体(sister chromatid)。
在有丝分裂中期所观察到的染色体是经过间期复制的染色体,均包含有两条成分、结构和形态一致的染色单体。染色体功能实现的三要素染色体功能实现的三要素着丝粒在染色体有丝分裂和减数分裂过程中发挥重要作用
端粒封闭了染色体末端并维持了染色体的稳定性
复制起点是DNA复制起始和染色体数目的维持所必需的
染色体的结构和组成染色体的结构和组成原核生物(prokaryote):细胞仅有膜和核糖体,几乎不存在其它复杂的细胞器,无真正的细胞核(无核膜)。
染色体为一条裸露的环状DNA或RNA(某些病毒、噬菌体)分子,有些为线状,仅与少量蛋白结合;染色体DNA多以负超螺旋方式盘绕形成拟核结构。null
真核生物染色体的组成细胞周期细胞周期nullnull
细胞分裂分为无丝分裂和有丝分裂两种,真核生物主要以有丝分裂为主。
有丝分裂包含两个紧密相连的过程:先是细胞核分裂,后是细胞质分裂,即细胞一分为二,各含一个核。
有丝分裂实现了细胞数目的增加,是细胞增殖的关键。减数分裂减数分裂减数分裂(Meiosis)是一种特殊的有丝分裂形式,仅发生于有性生殖细胞形成过程的某个阶段。其主要特点是:DNA仅复制一次,随后细胞连续两次分裂,形成单倍体的精子和卵子(形成四个细胞,染色体数目减半)。通过受精,形成合子,染色体数目恢复到体细胞的染色体数目。
减数分裂过程中同源染色体非姐妹染色单体间发生交换,使配子的遗传多样化,增加了后代的适应性,因此减数分裂不仅是保证生物种染色体数目稳定的机制,而且也是物种适应环境变化不断进化的机制。
细胞分化(cellular differentiation)细胞分化(cellular differentiation)定义:在个体发育中,由一个或一种细胞增殖产生的后代,在形态结构和生理功能上发生稳定性的差异的过程。
细胞分化是一种持久性的变化,细胞分化不仅发生在胚胎发育中,而是在一生都进行着,以补充衰老和死亡的细胞.如:多能造血干细胞分化为不同血细胞的细胞分化过程。一般来说,分化了的细胞将一直保持分化后的状态,直到死亡。
细胞分化代表细胞类型的增加,其本质是组织特异性基因在时间和空间上的差异表达。
第二节 基因与基因组第二节 基因与基因组一、基因一、基因遗传因子,“一个因子决定一个性状” 。
“基因论”,基因是直线排列在染色体上的遗传颗粒
三位一体的概念:
携带生物体遗传信息的结构单位。
控制一个特定性状的功能单位。
突变单位和交换单位。
“一个基因一个酶”
“一个顺反子,一条多肽链;一个基因一条多肽链基因的定义基因的定义基因 (gene)
合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。
一般是DNA序列(或RNA病毒中的RNA)。
具有编码一定生物功能分子的核苷酸序列。null原核基因的结构特点 null一个典型的真核基因
①编码序列:外显子(exon)
②插入外显子之间的非编码序列:内含子(intron)
③5'-端和3'-端非翻译区(UTR)
④调控序列(可位于上述三种序列中)null断裂基因(split gene) 在真核类结构基因组中,编码顺序被许多称为内含子的非编码区分割成几段称之为断裂基因。即由外显子和内含子相间排列组成的具有镶嵌结构的基因。
null结构基因与RNA的关系 小结小结基因 外显子(编码序列,coding sequence)
编码区 内含子(非编码序列)
非编码区(non-coding region ,如启动子,终止子,
上游调控序列)
编码区与非编码区针对能否转录成RNA而言;内含子与外显子一般针对真核生物mRNA 结构,原核生物则无此划分。二、基因组(genome)二、基因组(genome)是指一种生物体中的整套遗传信息,一般为一个受精卵或一个体细胞的细胞核中所有DNA分子的总和。
一特定生物体的整套(单倍体)遗传物质的总和。
基因组的大小用全部DNA的碱基对总数表示。
每种真核生物的单倍体基因组中的全部DNA量称为C值 (C-Value)。原核生物基因组原核生物基因组null真核生物基因组真核生物基因组真核生物:> 90%
原核生物:约50%null4.真核生物基因组中含有大量重复序列
5.真核生物的基因大多是不连续的真核生物基因组DNA序列的分类真核生物基因组DNA序列的分类 根据出现的频率不同可将DNA序列分为3类
1 、高度重复序列:重复次数>105的DNA序列
2、中度重复序列:重复次数为101~105。
3、单拷贝序列:大多数编码蛋白质的结构基因属这一类。
重复序列无转录活性null研究方法
重复序列是通过复性动力学测定发现的,即指变性的DNA两条链在一定条件下可以重新结合成双螺旋结构复性速度用Cot值衡量,Co为变性DNA的起始浓度,以mol/L表示,t为时间,以秒表示,Cot(克分子×秒/L)。 重复序列(repeat sequence)null
根据组织结构分布特点分为二类:
1、散在重复序列:以其单体形式散在分布于整个基因组中。
2、串联重复序列:各重复单位以头尾相连的形式串联重复存在于基因组中。null 各类重复序列的结构特征与功能
1、高度重复序列
高度重复序列中比较清楚的有两类,即卫星DNA和反向重复序列。
⑴卫星DNA(satellite DNA)
DNA的浮力密度与它的G-C碱基对含量有关,G-C含量高,浮力密度大,反之亦然。原核生物DNA中G-C含量较均匀,只显示一个峰;真核生物DNA中G-C含量不均匀,经超离心后,除了主峰外,还有小峰,这些小峰在主峰边上就像卫星一样,故名卫星DNA。
作用:与细胞有丝分裂有关。null null 人类DNA非编码区主要串联重复序列的类别
类别 重复单位大小(bp) 主要的染色体分布与功能
大卫星DNA (缠绕无活性控制染色体的运动)
(区块长度常为100kb~几个Mb)
卫星序列2和3 5 几乎所有染色体
卫星序列1 25-48 大多数染色体着丝粒区异染色质和其它异染区
αDNA 171 所有染色体着丝粒区异染色质
β(Sau3A家族) 68 主要在1、9、13、14、15、21、22和Y的着丝粒区异染色质
小卫星DNA
(区块长度常常为0.1kb~20kb)
端粒家族 6 所有端粒(端粒的功能、前述)
高度可变家族 9-24 所有染色体,常靠近端粒
微卫星DNA 1-4 所有染色体,功能不清楚
(区块长度小于150bp)null⑵反向重复序列
存在两种形式:A.两互补拷贝间无间隔序列如GGTACC
CCATGGB.两互补拷贝间有间隔序列如GGTNNNNACCCCANNNNTGG 电镜下,两种形式都呈十字形结构,有间隔的反向重复序列,在十字型结构两头形成两个小环。
作用:常见于基因组的调控区内,可能与复制和转录的调控有关。null2、中度重复序列
中度重复序列是复性速度介于单拷贝序列和高度重复序列之间的那部分DNA,重复频率101~105 。根据排列形式可分为:
①长散在重复序列(long interspersed repeated segments,LINES)
长度>1000bp(可达7Kb),拷贝数104-105,如人LINES
②短散在重复序列(Short interspersed repeated segments,SINES)
长度<500bp,拷贝数>105.如人Alu序列
作用:中度重复序列约占基因组的35%,有一部分是编码rRNA、tRNA、组蛋白及免疫球蛋白的结构基因,另一些可能与基因的调控有关。null1.SINEs(shat interspersed nuclear elements) 2.LINES(long interspersed nuclear elements)
代表 Alu家族(逆转录转座子) KpnI家族
(1)序列中含Alu限制酶位点 (1)序列中含KpnⅠ限制酶位点
(2)基因组中重复数3-5×105 (2)全长6-7kb
(3)Alu顺序之间间隔:3-5kb (3)Knp Ⅰ消化后可见4条带
(4)相对集中在染色体R带 (4)集中分布在染色体G或Q带
逆转录转座子 RNA介导转座 ,合成cDNA→基因组中度重复序列的特点中度重复序列的特点
① 重复单位序列相似,但不完全一样,
② 散在分布于基因组中.
③ 序列的长度和拷贝数非常不均一,
④ 中度重复序列一般具有种属特异性,可作为DNA标记.
⑤ 中度重复序列可能是转座元件。null基因家族基因家族基因家族:是指功能相似、核苷酸序列或编码产物具有一定程度同源性的基因.
可能由某一共同祖先基因经重复和突变产生。
基因家族的特点基因家族的特点① 基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因,如rRNA、tRNA和组蛋白的基因;
②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;
③有些成员不产生有功能的基因产物,这种基因称为假基因 (Pseudogene).
Ψa1表示与a1相似的假基因.
假基因(pseudogene):在核苷酸序列上与正常功能基因相似,但不能转录或转录后生成无功能基因产物的DNA序列,被称为假基因。基因家族分类基因家族分类编码RNA的:
rRNA 、tRNA、 snRNA等;
编码蛋白质的:
组蛋白基因
珠蛋白基因
生长激素null三、基因作图 将基因组中的基因或遗传标记分配在各个染色体上,并确定基因或标记间的距离的线性图称为基因组图谱。基因组图谱包括以染色体重组交换为基础的遗传图谱和以DNA的核苷酸序列为基础的物理图谱。 指将基因定位于某一特定的染色体上,以及测定基因在染色体上的线性排列的顺序与距离。(一)基因作图(基因定位)的定义:HGP的主要任务四张图:
物理图、 转录图
遗传图 、序列图 HGP的主要任务null 又称基因连锁图(linkage map)或染色体图(chromosome map),是以多态性遗传标记为界标,通过计算在细胞减数分裂过程中,由于同源染色体间交换所导致的遗传标记间发生重组的频率,来确定这两个标记间在染色体上的相对位置的图谱。 1、遗传图谱:图距:在遗传图谱上基因(或遗传标记)间的距离称为图距。图距单位以重组值1%去掉%号表示,单位为厘摩尔根(centimorgan,cM),1cM约为106bpnull多态性:人的DNA序列上平均每几百个碱基会出现一些变异(variation),并按照孟德尔遗传规律由亲代传给子代,从而在不同个体间表现出不同,因而被称为多态性(Polymorphism)。 null第一代多态性标记是RFLP(restriction fragment length polymorphism,限制性片段长度多态性)nullnull 第二代多态性标记是短的串联重复序列
包括小卫星DNA和微卫星DNA,其多态性主要来自重复序列拷贝数的变化null小卫星DNA—由15-65bp的基本单位串联重复而成,长度一般不超过20kb。
重复次数(小卫星DNA区的长度)在人群中是高度变异的;按照孟德尔的规律遗传微卫星DNA/简短串联重复(STR、STRP或SSLP)
重复单元2-8bp,通常重复10-60次CTAGCTTATATATATATATATATATATATAAGCTTGCnull第三代多态性标记是单核苷酸的多态性
(single nucleotide polymorphism,SNP)SNP:是由于单个核苷酸改变而导致的核酸序列多态,包括缺失、插入和替换/错配(主)。
null人类99.9%的基因密码是相同的,而差异不到0.1%,不同人群仅有140万个核苷酸差异。这些差异是由“单一核苷酸多样性”(SNP)产生的,它构成了不同个体的遗传基础。在整个基因组序列中,人与人之间的变异仅为万分之一,从而说明人类不同“种属”之间并没有本质上的区别。
nullSNP与RFLP和STR标记的主要不同之处在于,它不再以DNA片段的长度变化作为检测手段,而直接以序列变异作为标记。nullnull2、物理图
以已知核苷酸序列的DNA片段(序列标签位点,sequence-tagged site,STS)为“路标”,以碱基对如bp、kb、Mb等作为基本测量单位(图距)的基因组图。nullnull3、转录图
以EST(expressed sequence tag ,表达序列标签)为标记,根据转录顺序的位置和距离绘制的图谱。EST:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的5'或3'端序列称为表达序列标签(EST),一般长300-500bp左右。 null4、序列图(分子水平的物理图)
序列图是指整个人类基因组的核苷酸序列图,也是最详尽的物理图。1m
既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。
DNA的鸟枪法序列
技术 DNA的鸟枪法序列分析技术 null 1999 年 12
月用“逐个克隆法”获得第一条人类染色体 —22号染色体完成序列null 2000 年3 月用“全基因组鸟枪法”获得果蝇全基因组序列。
二、DNA的鸟枪法测序的主要步骤 二、DNA的鸟枪法测序的主要步骤 第一,建立高度随机、插入片段大小为2kb左右的基因组文库。
第二,高效、大规模的末端测序。
第三,序列集合。
第四,填补缺口。 null三、 DNA的鸟枪法测序的优缺点优点:速度快
缺点:
●随着所测基因组总量增大,所需测序的片段大量增加
●高等真核生物(如人类)基因组中有大量重复序列,导致判断失误四 比较基因组学及功能基因组学研究四 比较基因组学及功能基因组学研究一、比较基因组学(Comparative Genomics)
概念:是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。 null基本完成DNA序列分析的真核生物基因组比较null二、功能基因组学研究
1. 概念:利用结构基因组学提供的信息,以高通量,大规模实验方法及统计与计算机分析为特征,全面系统地分析全部基因的功能。null2. 基因功能的研究方法
(1) 基因转导技术:导入细胞,观察功能。该方法用的最多,技术最成熟。
null(2)基因敲除技术(gene knockout)
又称基因打靶(gene targeting)。这种技术是通过基因
的方法将一个结构已知但功能未知的基因去除,或用其他序列相近的基因取代(又称基因敲入),然后从整体观察实验动物,从而推测相应基因的功能。这种人为地把实验动物某一种有功能的基因完全缺失的技术称为基因敲除技术。