第 1卷 第2期
2010年 6月
热 带 生 物 学 报 JoURNAL oF TRoPICAL oRGANISMS V01.1 No.2
JuIL 2Ol0
文章编号:1674—7054(2010)02一O114—07
人类多囊肾病相关蛋白TM EM1 30基因的克隆
及生物信息学分析
齐兴柱 ,胡文婷 ,张俊芳 ,黄俊生 ,李 军
(1.海南大学 海洋学院,海南 海 口570228;2.海南大学 农学院,海南 海13 570228;
3.中国热带农业科学院环境与植物保护研究所,海南 儋州571737)
摘 要:以递交到 GenBank上的TMEM130蛋白基因序列(nm一152913)为
引物,以人大脑 eDNA文
库为模板进行巢氏PCR扩增,并将 PCR产物克隆到pMD18.T载体上,成功获得 TMEMI30蛋白基因编码序
列,测序结果显示,获得的序列为TMEM130蛋白基因转录变异体2,其编码序列长 1 272 bp。该基因定位在
人类第 7条染色体 7q22.1区域,有 3个转录变异体。生物信息学分析显示该序列可编码 1个含 423个氨基
酸的蛋白质 ;Smart mode程序显示该蛋白质是 1个跨膜蛋白,在 100~250号氨基酸序列之间有 1个与多囊肾
病(PKD)相关的结构域。因此,鉴定 TMEM130蛋白是一个与人类多囊肾病相关的蛋白。
关键词:TMEM130蛋白;多囊肾病;生物信息学;克隆
中图分类号:R 318.04 文献标志码:A
多囊肾病(Polycystic Kidney Disease,PKD)是一种肾小管囊肿进行性扩张以及正常肾小管的结构和功
能进行性丢失并最终导致终末期肾衰竭的遗传性肾脏疾病,可分为常染色体显性遗传性多囊肾病(ADP.
KD)、常染色体隐性遗传性多囊肾病(ARPDK)和成人多囊肾病(APKD)等。常染色体显性遗传性多囊肾
病(Autosomal Dominant Polycystic Kidney Disease,ADPKD)是人类最常见的单基因遗传病之一,发病率约
为0.1%⋯。其主要临床特征是双侧肾脏形成多个液性囊泡,囊肿进行性生长,导致肾脏结构和功能的损
害,至6o岁时约50%患者发展为终末期肾功能衰竭,约占终末期肾功能衰竭病因的10%。多囊肾病患者
除肾脏改变外,还可累及全身多个器官,如肝、胰、脾囊肿、颅内动脉瘤、高血压_2 等。常染色体隐性遗传
性多囊肾病 (Autosomal Recessive Polycystic Kidney Disease,ARPDK)属于单基 因遗传病,发病率在
1/40 000~1/20 000,临床
现为肾脏集合系统囊样扩张并伴有不同程度的胆囊发育不全、胆管扩张以及
肝门静脉周围纤维化。成人多囊肾病(Adult Polyeystic Kidney Disease,APKD)也是一种常染色体显性遗
传病,发病率高,大约有 1/1 000的人为致病基因携带者。多囊肾病为多发病,也是中年人尿毒症常见病
因。为研究人类 TMEM130蛋白的功能及其与人类多囊肾病的关系,笔者以人的大脑 cDNA文库为模板,
成功扩增并克隆了人类多囊肾病相关蛋白TMEM130转录变异体2的编码序列,并对该基因进行了相关
生物信息学分析和通过软件对该蛋白质的空间结构进行了预测。
1 材料与方法
1。1 人类多囊肾病相关的蛋白TMEM130基因编码序列的克隆 通过搜索 http: www.ncbi.nlm.nih.
gov/网站的Nucleotide数据库,得到一段人类 cDNA序列(登录号nm一152913),以该序列为模板,利用
Primer Premier5.0引物设计软件设计了2对 PCR引物:HTMEM130senl(5’,rrCTcGAGcTCCAcCTGcA,rrC
3 ),HTMEM130antl(5 CACTGAGATGGGGTGGGGAGG 3 ),HTMEMI30sen2(5 AATGGCCCAGGCAGTGT-
收稿 日期 :2010—03—19
基金项目:海南省教育厅高等学校科研项目(Hjkj2010—13);海南省自然科学基金(808122);海南热带水生生
物技术重点实验室开放基金(shkyjj0801).
作者简介:齐兴柱(1973一),男,湖南津市人,海南大学农学院2009级在职博士研究生.
第2期 齐兴柱等:人类多囊肾病相关蛋白TMEM130基因的克隆及生物信息学分析 1 15
GGT 3 ).HTMEM130ant2(5 AGccGGAGTGcTcAcACGGT 3 )。通过 NCBI网站的 UniGene数据库查询,
发现该基因有大量来自人类大脑组织的 EST序列数据,推测该基因在人类大脑组织中有表达。然后,以
人类大脑 eDNA(购 自 Clontech公司)文库为模板 ,进行巢氏 PCR扩增,首先,HTMEM130senl和 HT—
MEM13Oantl为引物进行第 1次 PCR扩增,然后以第 1次 PCR扩增产物为模板,HTMEM130sen2和 HT-
MEM130ant2为引物进行第 2次 PCR扩增。反应体系为:超纯水 16.2 IxL,10 X ExTaq buffer 2.5 ILL,dNTP
2.5 ILL,正向引物和反向引物各 1.3 ,模板 1 ,ExTaq DNA聚合酶0.2 ,总体积25 。第 1次
PCR反应条件为:94℃变性4 min,94 oC 30 s,52 cI=30 s,72℃ 2 min,30个循环,72℃ 延伸8 min;第 2次
PCR反应条件为94 cC变性4 min,94 oC 30 S,60 oC 30 S,72 oC 2 min,30个循环,72℃ 延伸8 rain。PCR
产物用琼脂糖凝胶电泳进行检测,目的片段经纯化回收试剂盒进行回收。连接反应采用 TAKARA公司
pMD18.T载体连接试剂盒进行,连接产物转化大肠杆菌 DH5c~感受态细胞,提取质粒并经酶切鉴定,然后
将克隆成功的样品送上海生工测序。
1.2 TMEM130基因的生物信息学分析 TMEM130基因组信息的分析通过http://W'~c3q.ncbi.nlm.nih.
gov/网站的Nucleotide、UniGene、UniSTS、数据库进行。同源序列的查询采用 http:∥www.nebi.nlm.nih.
gov/网站的blast在线软件进行。序列比对及进化树分析分别采用 ClustalX及 MEGA4.0软件进行。蛋白
质序列分析采用 DNAStar软件进行。蛋白质的结构域三维模型分析采用 SWISS-MODEL软件进行,并用
WebLab viewer显示 。
2 结果与分析
2.1 TMEM130基因的克隆及序列分析 以人类大脑 cDNA
文库为模板,PCR扩增人类 TMEM130基因的开放阅读框 cD—
NA序列,PCR产物长度在 1 ooo~1 500 bp之间,其附近无非
特异性条带(图 1),将产物纯化后克隆到T载体上进行测序,
测序结果如图2所示(只列出 1个测序反应),经 blast比对证
实克隆片段为人类 TMEM130基 因转录变异体 2(nm一
152913,blast比对结果未列出)的开放阅读框的 cDNA序列。
图3显示,TMEM130基因转录变异体 2的 cDNA全长 3 029
bp,开放阅读框长 1 272 bp,预测其编码 1个含423个氨基酸
的蛋白质。基因组信息查询发现该基因定位在人类第 7条染
色体7q22.1区域,在基因组上的跨度为23.562 kb,包含8个
外显子(图4),1号外显子长 274 bp,2号外显子长 306 bp,3
号外显子长 160 bp,4号外显子长 166 bp,5号外显子长 85
2 3 4
图 1 PCR产物电泳图
(1~3.第 2次 PCR产物;4.marker)
2 000 bp
1 500 bp
1 000 bp
bp,6号外显子长203 bp,7号外显子长 113 bp,该基因的转录本存在 3种拼接方式,即3种转录变异体
(transcript variant),其中,转录变异体 1的 8号外显子长 1 757 bp,转录变异体 2的 8号外显子长 1 721
bp,而转录变异体 3则没有2号外显子,其 8号外显子与转录变异体 2的8号外显子一样长(图4)。3种
转录变异体的5 端均有 189 bp的非翻译区,3 端均有 1 568 bp左的非翻译区.起始密码子均开始于 190
bp处,其周围的碱基序列是 GCAATGG,与 Kozak所描述的真核生物起始翻译序列 APGNNATGG相一致,
表明此 ATG是TMEM130基因编码序列的起始密码子。
A
TCTGC,CTTGCCTGCCTCCTGCCCTGGGCCCCGGCAGGGGTGGCCGCAGGCCTGTATGAACTC从TCTCACCACCGATAGCCCTGCCACCACGGGAGCGGTGGTGACC
ATCTCGGCCAGCCTGGTGGCCAAGGACAACGGCAGcCTGGcCcTGCcCGCTGACGccCACCTC1'ACCGCTTCCACTGGATCCACACCCCGCTGGTGCTTACTGGCAA
GATGGAGAAGGGTCTCAGCTCCACCATCCGTGTTGTCGGCCACGTGCCCGGGG从 TTCCCGGTCTCTGTCTGGGTCACTGCCGCTGACTGCTGGATGTGCCAGCCTG
TGGCCAGGGGCTTTGTGGTCCTCCCCATCACAGAGTTcCTCGTGGGGGACcTTGT丁GT(=ACCCAGAACACTTCCCTACcCTGGCCCAGcTcCTATCTCACTAAGACC
GTCCTGAAAGTCTCCTTCCTCCTCCACGACCCGAGCAACTTCCTCAAGACCGCCTTGTTTCTCTACAGCTGGGACTTCGGGGACGGGACCCAGATGGTGACTGAAGA
CTCCGTGGTCTATTATAACTATTCCATCATCGGGACCTTCACCG1、GAAGcTCAAAGTGGTGGcGGAG GGAAGAGGTGGAGCCGGATGCCACGAGGGCTGTGAAG(
AGAAGACCGGGGACTTCTCCGCCTCG( GAA( TGCAGGAAACCCTTCGAGGCATCCAAGTGTTGGGGCCCACCCTAATTCAGACCTTCCAAAAGATGACCGTGACC
TTGAACTTCCTGGGGAGCCCTCCTCTGACTGTGTGCTGGCGTCTCAAGCCTGAGTGCCTCCCGCTGGAGGAAGGGGAGTGCCACCCTGTGTCCGTGGCCAGCACAGC
GTACAACCTGACCCACACCTTCAGGGACCCTGGGGACTACTGCTTCAGCATCCGGGCCGAGAATATCATCAGCAAGACACATCAGTACCACAAGATCCAGTGTGCCC
TCCAGAATCAGCCGGCTGTCTTTGCTTTCCATGTGCTACACTTATCACTGTGATGTTGGGCTTCATCATGTACATGACCCTGCGGATG
l
10
100
190
图2 人类 TMEMI30基因克隆的测序及部分序列峰图
A.人类 TMEM130基因克隆的测序结果(只列出 1个测序反应);B.测序的部分序列峰图
ACAGAGcG,rCCCa GCGAGGACGAGcGAGCA
cGC黜 GAGGAGcGACCGCCGCAGTTCTcGAGCTCCAGcTGcATTCCCTCCGCG
礁 A Q A V W S R L
280 TATG从cTcAATCTCACCACCGATA
Y E L N L T T D S
AGCGGGCTG
CCGCc( GC,rG
G R I L l】I『 L A C L L P W A P A
GGGGTGGccGCAGGccTG
G V A A G L
CCTGCc7 四10 Gj【GC( rGG,I Tc rCG( 【Gc( G( G【 C7 C(;GC GC
P A T T G A V V T I S A S L V A K D N G S
370 cTGGccCTGCCCGCTGACGCCCACCTcTACCGCTTcCACTGGATCCACACCCCGCTGGTGCTTACTGGc从 GATGGAGAAGGGTcTcAGC
L A L P A D A H L Y R F H W I H T P L V L T G K M E K G L S
460 TCCACCATCCGTGTGGTCGGCCACGTGCCCGGGGAATTCCCGGTCTCTGTCTGGGTCACTGCCGcTGACTGCTGGATGTGCCAGCCTGTG
S T I R V V G H V P G E F P V S V W V T A A D C W M C Q P V
550 Gcc^GGGGcTTTGTGGTccTCCcCATCACAGAGTTCCTCGTGGGGGACCTTGTTGTCACCCAGAACACTTCCCTACCCTGGcCcAGcTCC
A R G F V V L P I T E F L V G D L V V T Q N T S L P W P S S
640 TATCTCACTAAGACCGTCCTGAAAGTCTCCTTCCTCCTCCACGACCCGAGCAACTTCCTCAAGACCGCCTTGTTTCTCTACAGCTGGGAC
Y L T K T V L K V S F L L H D P S N F L K T A L F L Y S W D
730 TTCGGGGACGG6ACCCAGATGGTGACTGAAGACTCCGTGGTCTATTAT从CTATTCCATCATCGGGACCTTCACCGTGAAGCTCAAAGTG
F G D G T Q 矗l V T E D S V V Y Y N Y S I I G T F T V K L K V
820 GTGGcGGAGTGGG从 GAGGTGGAG0CGGATGcCACGAGGGcTGTGAAGCAGAAGACCGGGGACTTcTccGCCTCGCTGAAGCTGCAGG从
V A E W E E V E P D A T R A V K Q g T G D F S A S L K L Q E
910 ACcCTTAGAGGCATCCAAGTGTTGGGGCCCACCCTAATTCAGACCTTCCAA^u^GATGACCGTGACCTTGAACTTCCTGGGGAGCOcTcCT
T L R G I Q V L G P T L I Q T F Q K M T V T L N F L G S P P
1000 CTGACTGTGTGCTGGCGTCTCAAGccTGAGTGCCTcCCGcTGGAGG从 GGGGAGTGCcACCCTGTGTCCGTGGCCAGCACAGCGTACAAC
L T V C W R L K P E C L P L E E G E C H P V S V A S T A Y N
1090 CTGAcCCACACCTTCAGGGACCCTGGGGACTACTGCTTCAGCATCCGGGCCGAGAATATCATCAGCAAGACACATCAGTACCACAAGATc
L T H T F R D P G D Y C F S I R A E N I I S K T H Q Y H K I
I 180 CAGGT( GGOCI CCAG从 TCCAGCCGGCTGTCTTTGCTTTCCCATGTGCTACACTTATCACTGTGATGTTGGCC1 CATCATGTACATG
Q V W P S R I Q P A V F A F P C A T L I T V M L A F I M Y M
1270 A。CCCTGCGGAATGCCACTCAGCAA^ A硬 G( G(蕊G7 C( =Ci G(刁 G1.Gi=,r 3i=a(G矾 口 赋 G
T L R N A T Q Q K D M V E N P E P P S G V R C C C Q M C C G
1360 CcT竹 CTTGCTGGAGACTcCATCTGAGTACcTGG从 ATTGTTCGTGAGAACCACGGGCTGCTCCCGCCCCTCTATAAGTCTGTCAAAACT
P F L L E T P S E Y L E I V R E N H G L L P P L Y K S V K T
I 450 TACACCGTGTGAGCACTCCCCCTCCCCACCCCATCTCAGTGTTAACTGACTGCTGACTTGGAGTTTCCAGCAGGGTGGTGTGCACCACTG
Y T V 木
1540 ACCAGGAGGGGTTCATTTGCGTGGGGCTGTTGGCI:TGGATCATCCATCCATCTGTACAGTTCAGCCACTGCCACAAGCCCCTCCCTCTCT
1630 GTCACCCCTGACCCCAGCCATTCACCCATCTGTACAGTCCAGCCACTGACATAAGCCCCACTCGGTTACCACCCCCTTGACCccCTAcCT
1720 TTG从 GAGGCTTCGTGCAGGACTTTGATGCTTGGGGTGTTCCGTGTTGACTCCCAGGTGGGCCTGGCTGCCCACTGCCCATTccTCTCAT
l8 l0 ATTGGCACATCTGCTGTCCATTGGGGGTTCTCAGTTTCCTCCCCCAGACAGCCCTACCTGTGCCAGAGAGCTAGAAAGAAGGTCATAAAG
1900 GGTTAAA从TccATAACTA从GGTTGTACAcATAGATGGGCACACTCACAGAGAGAAGTGTGCATGTACACACACCACACACACACACAC
1990 ACACAcAcAcAC^ CACACACACAG从 ATATAAACACATGCGTCACATGGGCATTTCAGATGATCAGCTcTGTATCTGGTT从 GTCGGTTG
2080 CTGGGATGCACCCTGCACTAGAGCTGAAAGGAAATTTGACCTCCAAGCAGCCCTGACAGGTTCTGGGCCCGGGCCCTCCCTTTGTGcTTT
2 170 GTCTCTGCAGTTcTTGcGCccTTTATAAC-GCCATCCTAGTCCCTGCTGC-CTGGCAGGGGGCTGGATGGGGGGCAGGACTAATACTGAGTG
2260 ATTGCAGAGTGcT下TAT从ATATCAccTTA1vrTTATcG从ACCcATCTGTGAAACTT,rCACTGAGGA从AGGcC个TGCAGCGGTAGAAGA
2350 GGTTGAGTCAAGGCCGGGCGCGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGTGGATCACGAGATCAGGAGATCG
2440 AGAOCACCCTGGCTAACACGGTGAAACCCCGTCTCTACTAAAAA从TACAAAAAGTTAGOCGGGCGTGGTGGTGGGTGCCTGTAGT£CCA
2330 GCT^ cGGG^ 6GcTG^ 66G^ GGA6^ ATGGT6cGAACCCGGGA66cGGAGc下TGcAGTGAGCCcAGATGGcGCCAcTGCAcTCCAG(:CTG
2620 AGTGAcAGAGCGAGACTc,rGTCTCCA从从AAAAAAAAGAAGAGGTTGAGTCAGcAGGGACTTGGGTTCCCTGTGTGTGAGGGGG6CATT
27 10 CTTGCCTGCCAGCTGCTCCCGAGGTGGCCTTGAGAAGG^uAGAAGCAGGATGACAGAGCCTGAGCAGCGGAACCAGCCTGCACCCTCCCTT
2800 CTGGCCCAGCGACCTGGGcTGTGGCTGAGACAATAATGAGGCCAGAAGTAGCCGGAGCCTGTCAGGAAGGGCAGGGGAGGACTGTGGGGT
2890 CTGGGCTCTGTCGCTGTAACCATCTGCTCCCAGGCTGTGTGCAGAAAATGGCATTTACACTATTGTGCAGCTCATTCTCATGAAATACTG
2980 CCATTGTTGcT从AT从AGCTTGTGTGcTCTG从TATAGCCAAGCATAGA 3029
图3 TMEM130基因转录变异体2的cDNA序列及其预测的编码蛋白
(其中,12—31及34O~362号氨基酸用下划线标出,是该蛋白质的跨膜序列。图中左边的数字表示核苷酸对序号。)
2.2 TMEM130基因的分子特征及其进化分析 经检索蛋白质数据库表明,人类 TMEM130蛋白质可能
是一个人类多囊肾病相关的蛋白,在哺乳动物和鸟类中存在多个同源蛋白质,如 NP_808403.2(Mus mM..$C//,-
,小鼠)、NP_001163870.1(Rattus norvegicus,大鼠)、NP_001076838.1(Bos taurus,黄牛)、XP_001136233.1
第2期 齐兴柱等:人类多囊肾病相关蛋白TMEM130基因的克隆及生物信息学分析 117
(Pan troglodytes,黑猩猩)、NP_O01126556.1(Pougo abelii,苏门答腊猩猩)、XP_O01494483.2(Equus cabal—
Z ,马)、EFB25467.1(Ailuropoda melanoleuca,大熊猫)、xP一001512168.1(Ornithorhynchus anatinus,鸭嘴
兽)、XP_001111417.1(Macaca mulatta,猕猴 )、xP一851082.1(Canis lupus familiaris,狗)、xP一414751.2
(Gallus gallus,红原鸡),XP_002192176.1(Taeniopygia guttata,斑胸草雀),但在低等动物、无脊椎动物以
及其他低等脊椎动物中没有发现 TMEM130蛋白的同源蛋白基因。这说明TMEM130蛋白基因是一个高
度进化的基因。笔者将人类 TMEM130蛋白质及其在其他物种中的同源蛋白输入 DNAstar软件,利用其
中的Clustal V程序进行同源蛋白序列比对排序,并利用其中的进化树分析程序进行了进化树分析(图5)
,表明该蛋白与黑猩猩、苏门答腊猩猩和猕猴的同源蛋白聚为一个大的分支,其中,人类TMEM130蛋白与
黑猩猩的 MEM130蛋白亲缘关系最近,其同源性达到93%,这与整个动物进化分支是一致的。
A
B
转录变异体1
/
j==== /
图4 人类TMEM130基因转录本的3种拼接方式,结果产生3种转录变异体。
图中1号外显子中的黑色方框表示 5 非翻译区,8号外显子中的黑色方框表示3 非翻译区
浅黑色方框表示外显子的编码区,虚线条表示内含子。
78. Ailuropoda melanoleuca
59。矿L—Canis lupus familiaris
L — Bos Taurus
I L——一 Equus caballus
厦l 67.0广Homo sapiens l 7
9. L Pan troglodytes
LPongo abe—lii—
Macaca mulatta
- - — — MUS musculus
Rattus norvegicus
91.9
L_.— 一 TaeniOpygia guttata
0rnithOrhynchus anatinus
90 80 70 60 50 40 30 20 10 0
Amino Acid Substitutions(xl 00)
Bootstrap Trials= 1000.seed=1 1 1
图5 人类 TMEM130转录变异体 2的蛋白及其同源蛋白的进化树
Gallus gallus
。 . . . . . 、
g蠢
.
、
、
、
、
、
.
.
.
. ~~
, 侉 妒
雾
转
一
118 热 带 生 物 学 报 2010正
2.3 TMEM130蛋白的结构域分析 笔者将克隆后测序并比对正确的TMEM130蛋白基因cDNA序列输
人 DNAStar软件中的EDITSEQ程序,预测到该编码序列的编码蛋白,由423个氨基酸组成,分子质量为
46 988.79 D,等电点为6.684。将该蛋白质输入到 NCBI蛋白质数据库中进行blast搜索,发现该蛋白质的
100~250号氨基酸组成结构是一个与人类多囊肾病即PKD相关的结构域。图6为该蛋白质与典型的人
类 PKD蛋白质结构域保守序列的比对结果。笔者将该蛋白序列输入在线 SWISS—MODEL软件,以1B4R
_
A
序列为模板分析蛋白质的结构域三维模型,并用 webLab viewer显示 ,获得了该蛋 白质的三维空间模
型 (图7)。图8显示的是典型Cn3D4.1软件显示的典型PKD结构域的三维空间模型示意图,其蛋白
质的二级结构含有 6个卢折叠区域 ,卢折叠区域之间也有 Ot螺旋,其超二级结构属于3种基本结构中的
卢Ol型。而图7显示的TMEM130转录变异体 2蛋白质的三维空间模型图中也有 3个 折叠区域。从 3
个卢折叠的排列和走向看,与图8中卢折叠区域非常类似。因此,笔者从 3个方面[1)蛋白质的序列组
成;2)与典型PKD结构域的序列比较(图6);3)TMEM130转录变异体 2蛋白的三维空间模型与典型PKD
结构域的三维空间模型比较(图7~8)]进行预测,鉴定该蛋白质是一个与人类多囊肾病相关的蛋白质。
将该蛋白质序列输入到smart mode在线软件,预测到该蛋白质 1~24号氨基酸为信号肽,同时,l2~31及
340~362号氨基酸为该蛋白的跨膜序列,因此该蛋白为膜蛋白。这与它的 PKD结构域及作为细胞膜上
的蛋白质与蛋白质或蛋白质与糖类相互作用的配基位点是一致的。
FlajoritY —H一—E—一V—V—一PEA--C—一P一-L-—.PLLX~C
DC