为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > NCBI注释说明

NCBI注释说明

2021-08-10 1页 doc 1MB 219阅读

用户头像

is_511210

暂无简介

举报
NCBI注释说明NCBI注释说明GeneBank序列注释说明GeneBank格式的序列中,有一些注释很难弄明白它的意思,通过搜索,终于找到了其原始的解释说明。现以NM_005715为一个简单的例子(##后面为说明)。LOCUS   NM_005715       4396bp  mRNA  linear PRI27-JUN-2012 ##说明accessionnum、序列长度和最后更新日期DEFINITION Homosapiensuronyl-2-sulfotransferase(UST),mRNA.##序列所在基因功能描述ACCESSIO...
NCBI注释说明
NCBI注释说明GeneBank序列注释说明GeneBank格式的序列中,有一些注释很难弄明白它的意思,通过搜索,终于找到了其原始的解释说明。现以NM_005715为一个简单的例子(##后面为说明)。LOCUS   NM_005715       4396bp  mRNA  linear PRI27-JUN-2012 ##说明accessionnum、序列长度和最后更新日期DEFINITION Homosapiensuronyl-2-sulfotransferase(UST),mRNA.##序列所在基因功能描述ACCESSION NM_005715 ##accessionnumVERSION  NM_005715.2 GI:194578911##accession版本号和所在基因GI号KEYWORDS  .SOURCE   Homosapiens(human) ##序列来源,即序列所在物种ORGANISM Homosapiens  ##序列物种生物学分类Eukaryota;Metazoa;Chordata;Craniata;Vertebrata;Euteleostomi;Mammalia;Eutheria;Euarchontoglires;Primates;Haplorrhini;Catarrhini;Hominidae;Homo.REFERENCE 1 (bases1to4396)##参考文献序号AUTHORS Uher,R.,Perroud,N.,Ng,M.Y.,Hauser,J.,Henigsberg,N.,Maier,W.,##参考文献作者Mors,O.,Placentino,A.,Rietschel,M.,Souery,D.,Zagar,T.,Czerski,P.M.,Jerman,B.,Larsen,E.R.,Schulze,T.G.,Zobel,A.,Cohen-Woods,S.,Pirlo,K.,Butler,A.W.,Muglia,P.,Barnes,M.R.,Lathrop,M.,Farmer,A.,Breen,G.,Aitchison,K.J.,Craig,I.,Lewis,C.M.andMcGuffin,P.TITLE  Genome-widepharmacogeneticsofantidepressantresponseinthe  ##参考文献标题GENDEPprojectJOURNAL AmJPsychiatry167(5),555-564(2010)             ##参考文献发的杂志PUBMED 20360315        ##在pubmed数据库中序号REMARK  GeneRIF:Clinicaltrialandgenome-wideassociationstudyofgene-diseaseassociation,gene-environmentinteraction,andpharmacogenomic/toxicogenomic.(HuGENavigator)REFERENCE 2 (bases1to4396)AUTHORS Trynka,G.,Zhernakova,A.,Romanos,J.,Franke,L.,Hunt,K.A.,Turner,G.,Bruinenberg,M.,Heap,G.A.,Platteel,M.,Ryan,A.W.,deKovel,C.,Holmes,G.K.,Howdle,P.D.,Walters,J.R.,Sanders,D.S.,Mulder,C.J.,Mearin,M.L.,Verbeek,W.H.,Trimble,V.,Stevens,F.M.,Kelleher,D.,Barisani,D.,Bardella,M.T.,McManus,R.,vanHeel,D.A.andWijmenga,C.TITLE  Coeliacdisease-associatedriskvariantsinTNFAIP3andRELimplicatealteredNF-kappaBsignallingJOURNAL Gut58(8),1078-1083(2009)PUBMED 19240061REMARK  GeneRIF:Observationalstudyofgene-diseaseassociation.(HuGENavigator)REFERENCE 3 (bases1to4396)AUTHORS Xu,D.,Song,D.,Pedersen,L.C.andLiu,J.TITLE  Mutationalstudyofheparansulfate2-O-sulfotransferaseandchondroitinsulfate2-O-sulfotransferaseJOURNAL J.Biol.Chem.282(11),8356-8367(2007)PUBMED 17227754REMARK  GeneRIF:analysisofdifferencesandsimilaritiesvariousresiduesplayinthebiologicalrolesoftheHS-2OSTandCS-2OSTenzymesREFERENCE 4 (bases1to4396)AUTHORS Ohtake,S.,Kimata,K.andHabuchi,O.TITLE  Recognitionofsulfationpatternofchondroitinsulfatebyuronosyl2-O-sulfotransferaseJOURNAL J.Biol.Chem.280(47),39115-39123(2005)PUBMED 16192264REMARK  GeneRIF:2OSTtransferssulfatepreferentiallytotheGlcAresiduelocatedinauniquesequence,-GalNAc(4SO(4))-GlcA-GalNAc(6SO(4))-.REFERENCE 5 (bases1to4396)AUTHORS Mungall,A.J.,Palmer,S.A.,Sims,S.K.,Edwards,C.A.,Ashurst,J.L.,Wilming,L.,Jones,M.C.,Horton,R.,Hunt,S.E.,Scott,C.E.,…………TITLE  TheDNAsequenceandanalysisofhumanchromosome6JOURNAL Nature425(6960),805-811(2003)PUBMED 14574404REFERENCE 6 (bases1to4396)AUTHORS Kobayashi,M.,Sugumaran,G.,Liu,J.,Shworak,N.W.,Silbert,J.E.andRosenberg,R.D.TITLE  Molecularcloningandcharacterizationofahumanuronyl2-sulfotransferasethatsulfatesiduronylandglucuronylresiduesindermatan/chondroitinsulfateJOURNAL J.Biol.Chem.274(15),10474-10480(1999)PUBMED 10187838COMMENT  VALIDATEDREFSEQ:Thisrecordhasundergonevalidationorpreliminaryreview.ThereferencesequencewasderivedfromAI570697.1,DB496757.1,BC093668.1,AB020316.1andCA842761.1.OnJul29,2008thissequenceversionreplacedgi:5032218.Summary:Uronyl2-sulfotransferasetransferssulfatetothe2-positionofuronylresidues,suchasiduronylresiduesindermatansulfateandglucuronylresiduesinchondroitinsulfate(Kobayashietal.,1999[PubMed10187838]).[suppliedbyOMIM,Mar2008].##RefSeq-Attributes-START##Transcript_exon_combination_evidence::AB020316.1,AK292922.1[ECO:0000332]##RefSeq-Attributes-END##PRIMARY  REFSEQ_SPAN    PRIMARY_IDENTIFIERPRIMARY_SPAN    COMP1-40        AI570697.1    1-4041-248       DB496757.1    18-225249-1537      BC093668.1    1-12891538-4015     AB020316.1    1345-38224016-4396     CA842761.1    1-381       cFEATURES      Location/Qualifierssource     1..4396         ##序列范围/organism="Homosapiens"##物种/mol_type="mRNA"     ##序列类型/db_xref="taxon:9606"  ##物种编号/chromosome="6"      ##所在染色体/map="6q25.1"       ##所在染色体区域gene      1..4396          ##包括在基因中的序列范围/gene="UST"       ##基因名称/gene_synonym="2OST"   ##基因名称别名/note="uronyl-2-sulfotransferase"##基因名称说明/db_xref="GeneID:10090"     ##在GeneBank中的ID号/db_xref="HGNC:17223"      ##在HGNC数据库中的ID号/db_xref="HPRD:10298"      ##在HPRD数据库中的ID号/db_xref="MIM:610752"      ##在MIM数据库中的ID号##有关种物种的数据库代号说明我会另外说明exon      1..543  ##一个外显子在序列中的区域/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign" ##外显子得到的比对所用工具/number=1STS      249..1540 ##STS(sequencetargetsite),在基因组中唯一存在的序列,用来作序列标记/gene="UST"/gene_synonym="2OST"/db_xref="UniSTS:485655" ##在UniSTS数据库中ID号misc_feature  249..251          ##生物学上有特殊意义,但区别于其它标记的区域/gene="UST"/gene_synonym="2OST"/note="upstreamin-framestopcodon"##序列说明CDS      297..1517 ##编码区/gene="UST"/gene_synonym="2OST"/note="dermatan/chondroitinsulfate2-sulfotransferase"##编码产物说明/codon_start=1/product="uronyl2-sulfotransferase"##编码产物/protein_id="NP_005706.1"     ##蛋白ID/db_xref="GI:5032219"/db_xref="CCDS:CCDS5213.1"   ##CCDS数据库ID/db_xref="GeneID:10090"/db_xref="HGNC:17223"/db_xref="HPRD:10298"/db_xref="MIM:610752"/translation="MKKKQQHPGGGADPWPHGAPMGGAPPGLGSWKRRVPLLPFLRFSLRDYGFCMATLLVFCLGSLLYQLSGGPPRFLLDLRQYLGNSTYLDDHGPPPSKVLPFPSQVVYNRVGKCGSRTVVLLLRILSEKHGFNLVTSDIHNKTRLTKNEQMELIKNISTAEQPYLFTRHVHFLNFSRFGGDQPVYINIIRDPVNRFLSNYFFRRFGDWRGEQNHMIRTPSMRQEERYLDINECILENYPECSNPRLFYIIPYFCGQHPRCREPGEWALERAKLNVNENFLLVGILEELEDVLLLLERFLPHYFKGVLSIYKDPEHRKLGNMTVTVKKTVPSPEAVQILYQRMRYEYEFYHYVKEQFHLLKRKFGLKSHVSKPPLRPHFFIPTPLETEEPIDDEEQDDEKWLEDIYKR"  ##翻译的氨基酸序列misc_feature  444..506/gene="UST"/gene_synonym="2OST"/inference="non-experimentalevidence,noadditionaldetailsrecorded"/note="propagatedfromUniProtKB/Swiss-Prot(Q9Y2C2.1);transmembraneregion"exon      544..587/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign"/number=2exon      588..743/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign"/number=3exon      744..823/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign"/number=4exon      824..977/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign"/number=5exon      978..1075/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign"/number=6exon      1076..1233/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign"/number=7exon      1234..4391/gene="UST"/gene_synonym="2OST"/inference="alignment:Splign"/number=8STS      4236..4336/gene="UST"/gene_synonym="2OST"/standard_name="D6S1148E"/db_xref="UniSTS:83075"ORIGIN   1ggcgcggcggggcgcggggcgtggggacgctagcgggcgccggacgggcgcggcgccccg61tcacgggcagcgccccgaaccggggccggacacctcggccgctcgggccgcggcggcggg………….还有很多在此例子中没有出现,现按字母顺序做一个汇总,方便大家查阅。利用NCBI查找基因信息检索基因的注释信息,在我们平常的学习和工作中经常会遇到,现总结归纳一下,好备不时之需。以human“UST”基因为例。1、打开NCBI主页,在数据库下拉框中选择”Gene”数据库,然后在边上的文本框中输入”UST”,点击”Search”,如图。2、由上可进入如下界面,此界面是对检索基因的一个简短描述。首先你要确定基因名称是否是你所搜的基因名称,如果结果的名称不是你搜索的名称,在基因名称别名(OtherAliases)那一行中看有没有你找的基因名称,如果还是没有,重新搜索一下这个基因其它的比较常用的名称。接着需要确认的是结果第一行右边中括号中物种名称是不是你想找的物种,如果只需要你所要物种的结果,可以点击右边栏中相应的物种结果。3、点击上面每个结果的第一个链接就可进入基因的详细注释信息。首先是一个对基因来源的注释,如下图。4、接着是基因所在基因组的一个图形化描述(如下图),可以很直观的看到其基因组信息,如6q25.1就是说明在第六条染色体25.1的位置,NC_000006.11是基因的accession号,各种accession命名可参考NCBI中RefSeq各种accession说明,(149068271..149398126)是此基因在其染色体上碱基范围。在右边的Epigenomics链接可以看到这个基因的功能注释信息,如组织表达关系,Cp岛等,MapViewer就像google地图一样,可以看到相邻基因及基因簇及整个染色体的情况,在其界面底下的Map5:RefSeqTranscriptsOnSequence下的Download链接可以得到所在基因簇的基因注释信息。5、接着下面是基因图形化显示(如下图)。基因组序列一般可以选择NC_开头的和AC_开头的,个人觉得默认的NC_更常用。右上方有三个链接分别可以以三种不同格式显示基因序列,如果对基因只想进行一个宏观的了解,就选择Graphics格式,如果只想得到基因序列就选择FASTA格式,如果想要得到基因的详细注释信息就要选择GeneBank格式,关于GeneBank格式注释说明,可以参考GeneBank序列注释说明。6、如果想知道其mRNA及编码蛋白信息,可以看下面的NCBIReferenceSequence(RefSeq)信息,下面会列出所有注释过的RefSeq信息,例如想知道mRNANM_005715.2的注释信息,直接点击就可以看到了。对于通过基因查找mRNA信息这未尚不是一种很好的办法。NCBI中RefSeq各种accession说明(一)我们在NCBI上找序列时,特别是看Blast结果时,经常会看到各种标记的序列,不知道哪个才是想要的,特此查了相关资料,找到了一些说明。根据个人经验,如果想找标准序列的话,mRNA就采用NM_开头的,基因组用NC_或者AC_开头的,有关RNA的编号说明,可以参考下一篇文章。具体的各项说明及序列来源说明请参考NCBI说明NCBI中RefSeq各种accession说明(二)在前面介绍了一些常见序列的accession号,其实在NCBI中还有很多accession号,仅与RNA相关的就有116种,这里各举一个例子供参考。不同的编码代号代表不同的意思,如NM_开头的表示标准序列,XM_表示预测的蛋白编码序列,NR_表示非编码蛋白的mRNA序列,AF开头的表示克隆序列,BC开头的表示序列,大家可以细细研究。miRNA命名规则miRNA命名,由miRBase制定了一系列规则。以hsa-mir-125b-2为例,前三个字母是物种代码,如hsa表示“人”,mmu表示“小鼠”,rno表示”大鼠“,关于其它物种代码,我会另外进行一个汇总;mir表示此miRNA是前体miRNA或者是miRNA基因,如果是miR则为成熟miRNA;接下来的数字125是编号,后面的字母“b”是miRNA基因变成成熟miRNA后对于只有一个或两个位置差异相似度非常高的miRNA之间的编号,例如hsa-mir-125a和hsa-mir-125b-1;紧接着后面的“-2”是区分前体miRNA不同而有一条成熟miRNA相同的标记,如hsa-mir-125b-1的成熟miRNA为hsa-miR-125b-5p和hsa-miR-125b-1-3p,hsa-mir-125b-1的成熟miRNA为hsa-miR-125b-5p和hsa-miR-125b-2-3p。对于成熟miRNA,中间会标记为”miR”,一般都会带后缀”-5p”或”-3p”,5p表示此成熟miRNA是由对应前体miRNA5′臂转化而来,3p表示此成熟miRNA是由对应前体miRNA3′臂转化而来,在18版本前的成熟miRNA有的会有后缀加”*“,有很多人发现后缀带”*”的在后面版本中一般变成后缀”3p”,但也有相当一部分后缀却变成”5p”,不能一概而论,一定要在miRBase数据库中核实。利用UCSC找序列的上下游基因如果有一段序列,想找到其上下游基因,方法很多,发现用UCSC比较直观明了。以下面这段人源序列为例,首先打开UCSC的Blat界面,选择基因组为“Human”,版本选择最新的“Fed.2009(GRCh37/hg19)”,其它的采用默认的,在文本域中拷入下面的序列,点击文本域下的“submit”提交就可以了。在接下来的页面选择第一个100%匹配的结果,如果你的序列有多个100%匹配的结果,那么说明此序列在基因组中多个位置存在。点击“browser”的链接就进入了浏览器模式,如果你想知道序列的详细情况可以点击旁边的“detail”。在浏览器模式下,首先设置显示的内容,默认的太多了,没法看,如果只想找基因的话,只需要下图标出的两个就可以了,其它的都设为“hiden”,设置好一组后就点上面的“refresh”,马上就可以看到上面图形的变化。下图显示了一些主要区域的说明,通过“zoomin”和“zoomout”放大缩小基因组的显示范围,通过左边”move”调整你的序列在图形在的位置,一个基因显示多排说明此基因有多个编码方式及对应多个accessionnum。通过不断缩小就可找到你的序列上下游基因如下图,其它东东可以自己一个个慢慢研究。如何利用NCBI中的Primer-BLAST引物Step1:GotoNCBI/Primer-BLASTwebpageStep2:InputPCRtemplate1.  InputyourPCRtemplatesequenceorinputtheaccession,giinNCBI.2.  Specifythepositionrangesofforwardandreverseprimersinthesequenceswhichyouinput.(Optionally) Note:ifyouentertheaccessionofgenomes,youcanspecifythegenomelocationshere.Step3:Setprimerparameters1.  Enteryourpre-designedprimers.(Optionally)2.  SettherangeofinterestedPCRproductsizes.3.  Setprimermeltingtemperatures.Step4:Checkprimerpairspecificity1.  Ifyouwanttocheckthespecificityofprimerpairs,checkthisoptionandthefollowingstepsarerequired.Otherwise,thefollowingstepscanbeignored.2.  Selectorganism(s)whichyouareinterested.3.  Selectdatabase(s)whichyouwant.Note:Generally,theorganismsanddatabaseshavetoberelatedwithyourinputsequences4.  Selectthemismatchedvaluehere.Ifthemismatchedvalueissethigher,thePCRproductfromcomputedprimersislessspecific.5.  Themisprimedproductsizedeviationissethere.6.  Click“Getprimers”tocomputeprimers.7.  WaittheservertocomputeprimersStep5:Getprimers1.  Theprogramgeneratestenresultsofcomputedprimerpairs2.  Thedetailedinformationofcomputedprimersshownintheredbox.3.  Ifyouchecktheoptionofspecificitycheck,thispartwillbeshown.Here,youcanseethepredictedPCRproductsofthecomputedprimersusingtheunintendedtemplateswhicharesetatstep3.2.
/
本文档为【NCBI注释说明】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索