结构基因组学研究概述
技术与应用 Technology and application of
结构基因组学研究概述
于 淼
,宁夏大学宁夏银川750021,
摘要,随着蛋白质数据库、基因组序列数据库和自动化技术的迅速发展,结构基因组学作为新的
蛋白质结构的技术显得越发重要。本文对结构基因组学的产生发展进行概述,分别介绍结构基因组技
功能 、实验
、蛋白质功能的预测方法 ,并对该学科发展进行了展望。
关键词,结构基因组学 三维结构 基因组
[ 2] 1 结构生物学与结构基因组学 而从这个世纪开始至今, 蛋。发展起来. 子结构
1 9 5 4 年, An f i n s e n 得出蛋白质肽 白结构解析与分析呈高速发展态势。 但人类基因组测序
,人体内有大约10 万个 链折叠的基本原则:蛋白质的氨基酸 明1 9 9 3 年, 英国《自然》杂志召开的分子
,同时人类的生命过 基因序列决定了蛋白质的立体结构。并因 生物学国际学术例会首次以结构生物
,它们是 此获得了1 9 7 2 年诺贝尔奖。1 9 6 0 年, 万种基础蛋白质学为主题, 并由p e t s k o 教授宣称结构
,而蛋白质的三维结构 Ma x P e ru tz 通过血红蛋白结晶的X 线 础2 0 0 0 年以来,这 生物学时代已经来临。
衍射晶体分析解出了世界上第一个蛋 个领域发展越来越快。最近的统计显 [ 3 ] 示蛋白质数据库 ( P r o t e i n D a t a 持其正常功能的基础。白质结构——血红蛋白的三维结构,[ 1 ] B a n k ) 中有超过1 3 0 0 0 种的蛋白质分 . 从此,蛋白质的结构解析工作渐渐 揭示生命活动的本质,必
的分子基础进行研究,通
蛋白质的三维结构分析
质结构与生物功能的关
组的结构与功能。
结构基因组学有两个
先测定解析一些经过选
所有的折叠类型的蛋白,
大。然后用这些典型的三
算机软件将其他蛋白质
来。可以用来分析蛋白质
生上的分布规律,但是当
技术还不能精确表现原子
这样细微的差别可能对
有重要影响,而许多细微
来,也可能会对整个分子
生明显的影响。所以这个
步完善。另一个是测定所
式生物的蛋白质表达谱
的蛋白质表达谱的所有蛋
方式不仅提供了更精确的
且进一步探索了蛋白质
技术与应用 Technology and application of
2 结构基因组学的研究过程 构表现出的功能一般是分子水平的。的结构信息,将会给生物学带来更多更
如今主要有三种通过蛋白质结构进行 深入的发现,从而把我们对生命的认识 现代的结构基因组学的原理与传
,只是 功能分析的方法:由三维结构特征推 统的结构生物学的原理及其相似提高到一个新的高度,并促进基因工程 研究的动机、自动化程度和规模不同。 测蛋白功能;由三维折叠的同源性推 和基因组学的迅速发展。对重大疾病相 这一研究的成功的关键在于优化了结 测蛋白功能;由空间结构进行计算机 关功能基因的蛋白质表达谱进行结构基 , 不同结构分析方 ,从而获得更为经济合理高 构测定步骤建模推断蛋白功能因组学的研究,对重大疾病的诊治,提高 [4] 法得到的功能信息误差率也有所不 效的方法。人们生活质量具有更为重要的意义。 [ 6 ] 同。S h a p i r o 等发现蛋白质A d ip o Q / 结构基因组学实验遇到了很多困 参考文献Ac r p 3 0 的结构与T N F 家族细胞因子 难,其中最显著的一个是:研究的每一 [1] Perutz.M.F.eal.Nature,183:416. t 的三维结构折叠的同源性相似,由次 . 由于单个蛋白 步都需要精制和优化[2] Structures by numbers.Nature, 推测它的功能与细胞因子相近。, 所 也有可能有非特异性的相互作用[ 7 ] 408:130 .Zarem bin ski等从高分辨晶体结构中 以对单个相关靶蛋白的研究通常被用 [3] 王大成.后基因组时代的结构生物 发现了一个与A T P 分子相结合的蛋 于一个蛋白家族的结构研究。对一个 A T P 酶 白,他们由此推测该蛋白具有学.生物化学与生物物理进展.27(4):340. 目标蛋白的成功的研究过程可以作为 的活性,并用生化实验证实了推测。[4] Steven E.Banner A toustrucr - of 一个结构基因组学研究的筛选的平
4 结构基因组学的影响和展望 台。许多目标蛋白同时开始进行实验 tural genomics.NaturReviews,2:801.e 研究, 在实验的每一个步骤都会有一 结构基因组的研究不但促进了生 [5] Moult J,Melamud E.From to fold 1 些不满足筛选条件的蛋白被淘汰。图物学和医学的发展,而且具有明显的现 function.Curr OpiStrucn in t Biol,2000, [ 5 ] 给我们提供了结构基因组学研究的 实意义和应用价值。由于蛋白质的功能 10(3):384. 基本实验过程。直接决定着生物体的生命活动,蛋白质 [6] Shapiro L,Scherer E.Th P e 3 结构基因组学蛋白质功能分析的种类及三维结构与其功能密切相关。 crystal structure of a complement 21q family 蛋白质的结构与功能之间的对应 所以不论是研究基因的功能,还是研究 protein suggests an evolutionarlink y to tumor 关系一直是蛋白质研究的核心问题, 表型的疾病过程,结构基因组学都是最
蛋白质的功能不仅与氨基酸的排列顺 necrosis factor.Curr Biol,1998,8(6) :335. 基础最直接的手段。对未知功能的蛋白
序有关,更与其空间折叠方式息息相 [7] ZarembinskTi I,Hung L W ,质进行三维结构的研究,有助于进行家
关。通过大量研究发现蛋白质三维结 Mueller2DieckmanJ,en t al.StructurH ebased 族归类及功能预测;从酶的三维结构可
构的保守性远大于其序列的保守性, 以推测出其调节区域及催化位点,从而 assignment of the biochemical function of a 所以对蛋白质功能的推测很大程度上 推断出催化机制;以药物靶分子的结构 hypothetical protein:a test case of struc - 依赖三维结构的分析。蛋白质的功能 为基础进行药物设计是当今发现新药的 [ 8] tural genomics.Proc Natl ScAcai USA,d 。随 着在不同层面上表现出:表型功能、细胞 最有效途径,促进了药理学的发展 1998,95(26):15189.结构基因组学的深入研究,产生大量, 而三维结 水平功能和分子水平功能[8] Wim G.J.H ol.Structuragenomics l for
science and society. Nature Struct.
Biol.November 2000,supplemen7:964. t
+ 小得多,故在等电点的计算中将氨基阳上接第2 3 H )页N 或胍基、咪唑基3 离子的解离常数予以忽略,而用两个羧 该氨基酸的等电点。故可用计算氨基酸 2 0 我们运用上述计算式分别对种溶液pH 值的计算式计算氨基酸的等电 基的解离常数计算氨基酸的等电点,其 氨基酸的等电点进行了计算,并与文献
点。在本科以上的生化教科书中给出了 计算式为:1: 给出的等电点进行比较,结果如表氨基酸等电点的计算式,但未加详细说 计算结果表明,用本文提出的计算p H = 1 / 2 p k ( - C O O H ) + 1 / 2 p k 1 明。对于中性氨基酸(一羧基、一氨基) 氨基酸等电点的方法所计算出的2 0 种 ( β- C O O H ) 来说,只有两个解离常数,其等电点的氨基酸的等电点与文献值基本一致。说 对于碱性氨基酸来说,分子中有一 明只要给出氨基酸的解离常数,便可计 个氨基未获得质子,因此在水中获得质 计算式为:p H = 1 / 2 p k ( - C O O H ) + 1 /1 算出氨基酸的等电点,作为测定时的参 子的能力比羧基负离子获得质子的能 2 p k ( - N + H ) 2 3 考数据是可行的,同时也进一步证实氨 力大得多,故在等电点计算中将羧基的 对于酸性氨基酸来说,有三个解离基酸确实是以两性离子形式存在。解离常数予以忽略,而用两个氨基的 常数。根据上述关于氨基酸溶液酸碱性 p ka 计算碱性氨基酸的等电点,计算式 分析,氨基阳离子失去质子的能力比来
参与质子传递的羧基失去质子的能力+ 为:p H = 1 / 2 p k ( - N H ) + 1 / 2 p k ( β-2 3