为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 提取直系同源基因粗略方案

提取直系同源基因粗略方案

2019-05-18 2页 doc 12KB 5阅读

用户头像

is_808969

暂无简介

举报
提取直系同源基因粗略方案ubuntu系统下借助trinity软件将cleandata数据进行拼接组装,此步骤运行需要附加工具,bowtieT和samtoolsV0.1.19用CD-HIT-EST软件进行进一步组装去重得unigenes;在ubuntu系统下运行OrthoMCL对全基因组进行聚类分析和同源基因查找,但对于RNA-SEQ组装后的转录本,EST数据,要加上HAMSTR这个软件,在此步骤中需要建本地管理数据库,以mysql为例,另外安装mcl软件,并安装和配置orthomcl软件;安装orthomcl数据库的表。首先,进入mysql数据库,新...
提取直系同源基因粗略方案
ubuntu系统下借助trinity软件将cleandata数据进行拼接组装,此步骤运行需要附加工具,bowtieT和samtoolsV0.1.19用CD-HIT-EST软件进行进一步组装去重得unigenes;在ubuntu系统下运行OrthoMCL对全基因组进行聚类分析和同源基因查找,但对于RNA-SEQ组装后的转录本,EST数据,要加上HAMSTR这个软件,在此步骤中需要建本地管理数据库,以mysql为例,另外安装mcl软件,并安装和配置orthomcl软件;安装orthomcl数据库的。首先,进入mysql数据库,新建一个名为orthomcl的数据库,然后,使用orthomclInstallSchema命令在数据库中创建一些表,这些表的名字则是orthomcl.config.template配置文件中指定的5个名称;创建orthomcl的输入文件,orthomcl的输入文件为fasta格式文件;过滤序列。对compliantFasta文件夹中的序列进行过滤,允许的最短的protein长度是10,stopcodons最大比例为20%;生成了两个文件goodProteins.fasta和poorProteins.fasta两个文件;对goodProteins.fasta中的序列进行BLAST。下载最新版本的Blast+,和最新版本的OrthoMCLDB的protein序列,将OrthoMCLDB的protein序列加上gooProtein.fasta中的序列合到一起做成一个biast+的数据库。然后对基因组的蛋白质序列进行比对;将similarSequences.txt载入到数据库中。对上一步biast的结果进行处理,从而得到序列的相似性结果,以用于导入到orthomcl数据库中。compliantFasta文件夹中包含下载下来的OrthoMCLDB的所有蛋白质数据的文件orthomcl.fasta;将similarSequences.txt载入到数据库中;寻找成对的蛋白质;将数据从数据库中导出;使用mcl进行对pairs进行聚类;对mcl的聚类结果进行编号;将得到的各个物种的直系同源基因用MEGA建树。
/
本文档为【提取直系同源基因粗略方案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索