为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 生物信息学 复习

生物信息学 复习

2017-10-17 12页 doc 37KB 26阅读

用户头像

is_589748

暂无简介

举报
生物信息学 复习生物信息学 复习 1. 什么是生物信息学,生物信息学为什么重要,(10分) 2. 简述生物信息学目前要解决的主要问题,(15分) 3. 什么是序列比对,序列比对有什么作用,(10分) 4. 序列比对的关键问题有哪些,(10分) 5. BLAST软件的算法特点是什么,(10分) 6. 什么是基因结构预测,有哪几类方法,(10分) 7. 简述基因结构从头预测(ab initio)方法,(15分) 8. 通过基因结构预测的学习,你在生物信息学研究方法方面有何体会,(10分) 9. 在生物信息学所涉及的众多内容中,你...
生物信息学 复习
生物信息学 复习 1. 什么是生物信息学,生物信息学为什么重要,(10分) 2. 简述生物信息学目前要解决的主要问题,(15分) 3. 什么是序列比对,序列比对有什么作用,(10分) 4. 序列比对的关键问题有哪些,(10分) 5. BLAST软件的算法特点是什么,(10分) 6. 什么是基因结构预测,有哪几类方法,(10分) 7. 简述基因结构从头预测(ab initio)方法,(15分) 8. 通过基因结构预测的学习,你在生物信息学研究方法方面有何体会,(10分) 9. 在生物信息学所涉及的众多内容中,你比较感兴趣的是什么,(5分) 10. 对于生物信息学的学习,你希望毕业时达到什么目标,(5分) 11. 什么是生物信息学,你目前已了解的生物信息学研究内容有哪些,举例说 明生物信息学为什么重要,(20分) 12. 以基因结构注释为例,总结生物信息学研究的基本策略与方法,(20分) 13. 双序列比对的目标是什么,双序列比对的关键问题有哪些,对于这些问题, 各给出一种解决(20分) 14. 对于利用序列保守性识别Donor位点这一相对较简单的问题,试给出采用 WWM或WAM方法解决该问题的完整步骤,并提出有可能进一步提高识别 效果的设想(25分) 15. 要做好生物信息学的研究与应用,你认为应掌握好哪些方面的知识与技能, (15分) THE ASSIGNMENT FOR BIOINFORMATICS Chapter 1 ppt1 1. 什么是生物信息学,(狭义和广义) 生物信息学广义的概念是指应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。生物信息学狭义的概念是指应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。 2. 生物信息学的发展历史。 , 20世纪50年代,生物信息学开始孕育。 , 20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联 系起来。 , 20世纪70年代,生物信息学的真正开端。 , 20世纪70年代到80年代初期 ,出现了一系列著名的序列比较方法和 生物信息分析方法。 , 20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库。 , 20世纪90年代后 ,HGP促进生物信息学的迅速发展。 3.人类基因组和基因组信息学的相互作用。 人类基因组计划简介:人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其 中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。 基因组:一个物种中所有基因的整体组成。 人类基因组构成——24条染色体和线粒体。 建立四张图谱:遗传图谱;物理图谱;序列图谱;转录图谱。 相互作用: 4.用狭义的方式来诠释核酸序列和蛋白质结构序列。 5. 生物信息学的目标和任务 收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。 6.生物信息学主要研究内容。 (1)生物分子数据的收集与管理;(2)数据库搜索及序列比较 ;(3)基因组序列分析; (4)基因表达数据的分析与处理 ;(5)蛋白质结构预测。 7.生物信息学所用的方法和技术。 (1)数学统计方法;(2)动态规划方法 ;(3)机器学习与模式识别技术 ;(4)数据库技术及数据挖掘 ;(5)人工神经网络技术;(6)专家系统 ;(7)分子模型化技术;(8)量子力学和分子力学计算 ;(9)生物分子的计算机模拟;(10)因特网(Internet)技术。 Chapter 2 PPT 2 1. 生物大分子构成的三条基本原则: (1)构成生物体各类有机大分子的单体在不同的生物中都相同; (2)生物体内一切有机大分子的构成都遵循共同的规则; (3)某一特定生物体所拥有的核酸及蛋白质分子决定了它的属性。 2. 真核细胞和原核细胞的区别: 比较项目 原核生物 真核生物 细菌、蓝藻、放线菌、衣原实 酵母菌等真菌、衣藻、 体、支原体(支原体细胞最 例 高等植物、动物 小,且无细胞壁) 细胞大小 较小(1,10微米) 较大(10,100微米) 细胞壁不含纤维素,主要成 细胞壁的主要成分是纤维素 分是肽聚糖;细胞器只有一 和果胶;有核糖体、线粒体、细胞 种,即核糖体;细胞核没有 内质网、高尔基体等多种细 核膜(这是最主要的特点)、结构 胞器;细胞核有核膜、核仁、 没有核仁、没有染色质 有染色质(体) (体),但有核物质,叫拟 核 主要细胞 有丝分裂、无丝分裂、减数 二分裂 分裂 增殖方式 同化作用多为异养型、少数 为自养型(包括光合作用和同化作用有的是异养型、有代 化能合成作用自养型),异的为自养型,异化作用有的谢 化作用多为厌氧型、少数为为厌氧型、有的为需氧型。 需氧型。光合作用的部位不光合作用的部位是叶绿体;类 是叶绿体而是在光合片层有氧呼吸的主要部位是线粒型 上;有氧呼吸的主要部位不体 在线粒体而是在细胞膜 生殖方式 无性生殖(多为分裂生殖) 有性生殖、无性生殖 遗 传 DNA DNA 物 质 遗传方面 拟核(控制主要性 DNA细胞核(控制细胞核遗传), 状);质粒(控制抗 分线粒体和叶绿体(控制细胞 药性、固氮、抗生素 布 质遗传) 生成等性状) 基编码区是连续的,无编码区是不连续的、间隔的, 因内含子和外显子 有内含子和外显子 结 构 转录产生的信使RNA需要加 转录产生的信使RNA工(将内含子转录出的部分 基不需要加工;转录和切掉,将外显子转录出的部 因翻译通常在同一时分拼接起来);转录和翻译 表间同一地点进行(在不在同一时间同一地点进行 达 转录未完成之前翻(转录在翻译之前,转录在 译便开始进行) 细胞核内、翻译在细胞质的 核糖体) 遵 循细胞核遗传遵循基因分离定 遗不遵循基因分离定律和自由组合定律,细胞质 传律和自由组合定律 遗传不遵循基因分离定律和 规自由组合定律 律 可遗传变基因突变、基因重组、染色 基因突变 异的来源 体变异 进化水平 低 高 生态系统 生产者、消费者、分解者 生产者、消费者、分解 的成分 3. 遗传定律(孟德尔) 4.蛋白质和DNA的构成单元。 , 氨基酸(amino acid)是蛋白质的基本结构单位。 , 核苷酸是DNA的基本结构单位。 5.中心法则。 6.DNA是怎样编码的, 基因是DNA上一段特定的碱基序列,携带遗传信息,一条DNA上有几个基因并不确定,因DNA不同而不同 。三个碱基编码一个氨基酸,不同的碱基序列编码不同的氨基酸序列(即蛋白质的一级结构),氨基酸间脱水形成肽,肽经一定的盘旋折叠形成具有空间特异性结构的蛋白质,形成不同的蛋白质,即蛋白质的翻译过程。 7.蛋白质的一二三级结构。 蛋白质的一级结构是指多肽链中氨基酸的序列 蛋白质的二级结构主要有以下几种形式: (i),螺旋 ;(ii),折叠 – 平行折叠 反平行折叠 ;(iii),—转角 – 连接作用 (iv)无规卷曲-没有确定规律性的肽链构象,但仍然是紧密有序的稳定结构。 (v)无序结构。 蛋白质的三级结构(tertiary structure) 在二级结构基础上的肽链再折叠形成的构象。 ,型—主要是由,螺旋所构成; ,型—主要由反平行的,折叠所构成,,折叠片之间以,转角连接; ,/,型—由,螺旋包裹的以平行,链为主的,—,—,花样所构成。 Chapter3 PPT 3 1. 序列分析的任务和目的。 序列比较的根本任务是:(1)发现序列之间的相似性;(2)辨别序列之间的差异 目的: 相似序列 , 相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 2. 基本打分表。 打分矩阵(Weight Matrices) , (1)核酸打分矩阵设DNA序列所用的字母表为 , = { A,C,G,T } a. 等价矩阵 b. BLAST矩阵 c. 转移矩阵(transition,transversion) (嘌呤:腺嘌呤A,鸟嘌呤G;嘧啶:胞嘧啶C,胸腺嘧啶T) (2)蛋白质打分矩阵 , (i)等价矩阵 其中Rij代表打分矩阵元素 i、j分别代表字母表第i和第j个字符。 , (ii) 氨基酸突变代价矩阵GCM , (iii)疏水矩阵 , (iv)PAM矩阵(Point Accepted Mutation) , (v) BLOSUM矩阵 (Blocks Amino Acid Substitution Matrices) Chapter 4 PPT 4 1. 为什么要构建生物分子数据库。 (1)生物分子数据高速增长 (2)分子生物学及相关领域研究人员迅速获得最新实验数据。 2. 一二级数据库(怎样查,) Page 56 一级数据库 , 数据库中的数据直接来源于实验获得的原始数据,只经过简单的 归类整理和注释 二级数据库 , 对原始生物分子数据进行整理、分类的结果,是在一级数据库、 实验数据和理论分析的基础上针对特定的应用目标而建立的 。 3.国际上权威的核酸序列数据库 (1)欧洲分子生物学实验室的EMBL 。 (2)美国生物技术信息中心的GenBank。 (3)日本遗传研究所的DDBJ。 Chapter 5 PPT 5 1.关于密码子 (1)密码子的使用是非随机的 如果密码子的第一、第二位碱基是A、U,那么第三位将尽可能使用G、C;反之亦然。 如果三位都用G、C,则配对容易,分解难;三位都用A、U,则相反。 一般地说,高表达的基因,翻译速度快,要求密码子和反密码子配对快、分手也快。 (2)密码子的使用有一定的统计规律 对同义密码子的使用存在着偏爱 不同种属偏爱的密码子不同 人类基因组: 密码子第三位取A、U的情况占90% 而第三位取G、C仅占10% 密码子的使用偏性与基因功能、蛋白质结构相关 (3)密码子中的密码 三个碱基的位置与所编码的氨基酸性质存在着联系 例如: • 芳香族氨基酸——以U作为第一位碱基 • 中间位置碱基的性质与氨基酸是亲疏水性相关 疏水氨基酸的密码子,其第二位碱基是U 亲水氨基酸的密码子,其第二位碱基是A 第二位碱基是G、C的密码子所编码的氨基酸亲水性、疏水性居中。 2.基因分析中所关注的, , 原核基因识别:重点在于识别编码区域 , 非翻译区域(untranslated regions, UTR) 编码区域两端的DNA,有一部分被转录,但是不被翻译,这一部分称为非翻译区域 , 5’UTR---基因上游区域的非翻译区域 ;3’UTR---基因下游区域的非 翻译区域 , 对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位 置,可以按照三种方式进行解释。 , 这三种阅读顺序称为阅读框(reading frames) 一个开放阅读框(ORF,open reading frame)是一个没有终止编码的密码子序列。 原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。 Chapter 6 PPT 6 1. 什么是系统发生、系统发生学、系统发生树, 系统发生(phylogeny)——是指生物形成或进化的历史。 系统发生学(phylogenetics)——研究物种之间的进化关系。 系统发生树(phylogenetic tree)——表示形式,描述物种之间进化关系。 2. 有根数、无根树的构建。 系统发生树的构建方法分为两大类: (1)基于距离的构建方法:非加权组平均法 ;邻近归并法 ;Fitch-Margoliash 法 最小进化方法 (2)基于离散特征的构建方法:最大简约法;最大似然法;进化简约法;相容性方法 Chapter 7 PPT 7 1. 为什么要对protein进行预测, Page 181 寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射。 2. 蛋白质预测的思路和方法。 思路: • 蛋白质结构预测主要有两大类方法: (1)理论分析方法 – 通过理论计算(如分子力学、分子动力学计算)进行结构预测。 (2)统计的方法 – 对已知结构的蛋白质进行统计分析,建立序列到结构的映射模 型,进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预 测结构。 – 包括: • 经验性方法 • 结构规律提取方法 • 同源模型化方法 Chapter 8 PPT 8 1. 生物芯片定义。 基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。 • 基因芯片把大量已知序列探针集成在同一个基片上,经过标记的若干靶 核酸序列通过与芯片特定位置上的探针杂交,便可根据碱基互补匹配的 原理确定靶基因的序列。 • 基因芯片(gene chip),又称DNA微阵列(microarray),是由大量 cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是 通过杂交检测信息。 • 基因芯片把大量已知序列探针集成在同一个基片上,经过标记的若干靶 核酸序列通过与芯片特定位置上的探针杂交,便可根据碱基互补匹配的 原理确定靶基因的序列。 ,、基因芯片对于生物分子信息检测的作用和意义 • 在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强 有力的手段。 • 利用基因芯片技术,可研究生命体系中不同部位、不同生长发育阶段的 基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病状态 下基因及其表达的差异。 • 基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发 现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。 生物信息学在基因芯片中的应用: • 生物信息学在基因芯片中的应用主要体现在三个方面: • 确定芯片检测目标 • 芯片 • 实验数据管理与分析
/
本文档为【生物信息学 复习】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索