null
生物信息学及其应用
生物信息学及其应用
路新枝
2006年6月22日
主要内容主要内容生物信息学简介
生物信息学的产生和发展
生物信息学在蛋白组学研究中的作用
问题和展望生物信息学简介生物信息学简介生物信息学是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释。
它的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”,解释生命的遗传语言。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。
近来的研究表明,基因组不仅是基因的简单排列,它有其特有的组织结构和信息结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。弄清楚生物体基因组特有的组织结构和信息结构,解译生命的遗传语言的关键。
生物信息学的研究内容生物信息学的研究内容生物信息的收集、存储、管理与提供 包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息可视化和专家系统。
基因组序列信息的提取和分析 包括基因的发现与鉴定,如利用国际EST 数据库 (dbEST) 和各自实验室测定的相应数据,经过大规模 并行计算发现新基因和新SNPs以及各种功能位点;基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与DNA折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。
功能基因组相关信息分析 包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究。
null生物大分子结构模拟和药物设计 包括RNA(核糖核酸)的结构模拟和反义RNA的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于DNA结构的药物设计等。
生物信息分析的技术与方法研究 包括发展有效的能支持大尺度作图与测序需要的软件、数据库以及若干数据库工具;创建一切适用于基因组信息分析的新方法、新技术。包括引入信息系统分析技术等;建立严格的多序列比较方法;发展研究基因组完整信息结构和信息网络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。
应用与发展研究 汇集与疾病相关的人类基因信息,发展患者样品序列信息检测技术和基于序列信息选择表达载体、引物的技术,建立与动植物良种繁育相关的数据库以及与大分子设计和药物设计相关的数据库。生物信息学的产生和发展生物信息学的产生和发展背景:
1865年,孟德尔遗传三大定律的发现;
1953年,DNA双螺旋结构的发现;
20世纪80-90年代信息技术迅猛发展。
产生与发展:
萌生于计算机初创时期;
生物信息的积累:建立三大核酸数据库
20世纪80年代末期bioinformatics正式诞生;
测定全基因组序列
null1995
流感嗜血杆菌 1830 Kb1997
酵母
12.7 Mb1998
线虫 9700 Kb2002
水稻
~430 Mb2001
人
~3 Gb2000
果蝇
137 Mb 从基因到蛋白质从基因到蛋白质蛋白质组学蛋白质组学“The identification, characterization and quantification of all proteins involved in a particular pathway, organelle, cell, tissue, organ or organism that can be studied in concert to provide accurate and comprehensive data about that system.”
“对特定的通路、细胞器、细胞、组织、器官和肌体中包含的所有蛋白质进行鉴定、表征和定量,并提供关于该系统准确和全面的数据。”
http://www.inproteomics.com/prodef.html 生物信息学在蛋白质组学研究中的作用生物信息学在蛋白质组学研究中的作用J. Biotechnol. 2003, 106, 147-156.生物信息学在蛋白组研究中的应用生物信息学在蛋白组研究中的应用1. 编码的DNA序列的寻找与分析(分析研究对象);
2. 蛋白质序列信息的获取(搜索与测序);
3. 蛋白质鉴定和性质预测;
4. 蛋白质序列分析;
5. 蛋白质结构和功能预测;
编码的DNA序列的寻找与分析编码的DNA序列的寻找与分析找寻DNA的开放阅读框 翻译编码区
工具:美国国家生物技术信息中心(NCBI)提供的“ORF Finder”
欧洲生物信息研究所(EBI)提供的Protein machine
www2.ebi.ac.uk/translate/
其它资源
1)美国国家生物技术信息中心(NCBI):
GenBank核酸序列数据库,
www.ncbi.nlm.nih.gov/genbank;
2)欧洲生物信息研究所(EBI):
欧洲分析生物学实验室核酸数据库(EMBL),
www.ebi.ac.uk;
3)日本国立遗传学研究所:
日本DNA数据库(DDBJ),
www.ddbj.nig.ac.jp。获取蛋白质序列信息获取蛋白质序列信息1. 在数据库中搜索
Georgetown大学医学中心的PIR-PSD
pir.georgetown.edu/pirwww
瑞士生物信息研究所(SIB)和欧洲生物信息研究所(EBI)共同维护的SWISS-PROT/TrEMBL数据库
www.expasy.org/swissprot
2.直接测序:
传统方法:Edman降解法及其衍生方法,固相测序法等
新方法:质谱法测序(MALDI-TOF,ESI-MS) 质谱法测序
1.肽段质量指纹图谱(PMF)质谱法测序
1.肽段质量指纹图谱(PMF) 步骤:蛋白被蛋白酶专一性酶解后,用质谱检测生成的肽段,形成由各肽段质量组成的质谱图,将得到的质量谱图与数据库中通过计算得到的理论谱图进行比较,进行鉴定。
代表方法:
2DPAGE-MALDI-TOF Proteomics 2004, 4, 619-626.
J. Biotechnol. 2003, 106, 147-156.
J. Mass Spectrom. 1998, 33, 1-192. 多肽片段指纹图谱(PFF)2. 多肽片段指纹图谱(PFF) 步骤:用酶专一性酶解蛋白质,经过分离,得到的肽段在质谱中被选择和破碎后得到MS/MS谱图,与数据库中的谱图比较进行鉴定
代表方法:
LC-ESI-MS/MS
2D-LC-MS/MS(shotgun) Proteomics 2004, 4, 619-626.
J. Biotechnol. 2003, 106, 147-156.
J. Mass Spectrom. 1998, 33, 1-19蛋白质鉴定和性质预测蛋白质鉴定和性质预测一、 蛋白质鉴定:
1. 检索工具和算法:
PMF——MS-Fit(Prospector的一部分)、ProFound、Mascot;
PFF——Mascot、SEQUEST、Emowse(EMBOSS软件包)。
2. 网络鉴定工具:
AAComldent工具 www.expasy.ch/tools/aacomp
PeptideMass工具 www.expasy.ch/tools./peptide-mass.html
3. 数据库资源:
PIR-PSD: http://pir.georgetown.edu/pirwww/
SWISS-PROT:http://us.expasy.org/sprot
……
nullhttp://pir.georgetown.edu/pirwww/nullhttp://www.expasy.org/swissprot/4. De novo sequencing 4. De novo sequencing 即手动解释谱图,无须使用数据库检索程序,已有辅助工具。
Tools:
Lutefisk: http://www.hairyfatguy.com/Lutefisk (free)
De Novo: http://hto-c.usc.edu:8000/msms/menu/denovo.htm (web)
PEAKS: http://www.bioinformaticssolutions.com/Software/peaks/index.php蛋白质性质预测蛋白质性质预测1. 物理化学性质预测
预测相对分子量、氨基酸组成、等电点、消光系数等
ProtParam工具(www.expasy.ch/tools/protparam.html)
Compute pI/Mw 工具(www.expasy.ch/tools/pi_tool.html)
2. 蛋白质的疏水性分析
ProtScale(www.expasy.ch/tools/pscale/)
3. 蛋白质二级结构预测网站
nnpredict(www.cmpharm.ucsf.edu/~nomi/nnpredict.html)
PredictProtein(www.embl-heidelberg.de/predictprotein/predictprotein.html)
JPRED(jura.ebi.ac.uk:8888/)蛋白质序列分析蛋白质序列分析null相似性搜索(或同源搜索)
模体(motif)搜索和结构域定位
多重序列比对
同源模建问题和展望问题和展望数据库的完善数据注释的准确性和完整性、格式的统一
综合性数据库和网站可供使用
更多新的免费检索、分析工具的出现
自定义的本地数据库的构建谢 谢!谢 谢!