为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

Lm

2014-03-10 12页 pdf 611KB 27阅读

用户头像

is_720955

暂无简介

举报
Lm Latent Models©z�Ö�w 2014c 3� 10F Contents 1 PPCA 3 1.1 Úó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 PPCA�. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1....
Lm
Latent Models©z�Ö�w 2014c 3� 10F Contents 1 PPCA 3 1.1 Úó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 PPCA�. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.1 Ïf©Û†PCA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2 VÇ�.�Ú\ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.3 ëê�O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2.4 PPCA†PCA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 PPCA�`³Þ~ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3.1 ?n"”êâ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3.2 ?n·Ü�. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4 �( . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 LDA 7 2.1 Úó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 LDA�. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2.1 ⊆ÎÒ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1 2.2.2 �)ª��. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.2.3 LDA�. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.2.4 ÄuLDA�íäÚëê�O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2.5 A^†�( . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3 o( 11 2 1 PPCA 1.1 Úó PCA(Principle component analysis)´˜«�2¦^�êâü‘Eâ"PCAÏL�3$��̤ ©�±êâ¥é��zŒ�A�§�Ñp��̤©5?1�D½ö§�Øéêâ&E�z،� A�"˜«Ï~�Š{´µb�kN ‡d ‘���tn, n ∈ {1, 2, · · · , N}, ��þŠt §�����Ý µ S = 1 N N∑ n=1 (tn − t)(tn − t)T OŽ��Ý �A�ŠÚéAA�•þSwi = λiwi, ¿UA�ŠlŒ��üS§��cq ‡Œ�A �ŠéA�A�•þW = (x1, w2, · · · , wq) |¤q ‡Ì¤©�•§éz‡��ü‘(Ӟ�¥%z)3q ‘˜m�(Jµ xn = W T (tn − t) n = 1, 2, · · · , N PPCA(Probabilistic PCA)´ÄuGaussianÛ�Cþ§^VÇ�ª‰ÑPCA�˜«�)ª�.� £ã§l U ÏLŒq,�O§·Ü�.§EMŽ{�·^uVÇ�.�{éÄ��PCA {? 1*Ð" �©�̇ë©zµ[1] 1.2 PPCA�. 1.2.1 Ïf©Û†PCA PCA†Ïf©Û(Factor Analysis, FA)�'X—ƒ"Ïf©Û�Ä�8�´ Ïé$‘�Ï f(”factor”)5L«p‘�êâ§$‘ÏfU Jøép‘êâ�{��)º"b�$‘Ïf†p‘ê⠃mk‚5'X§t p‘ê⧠x $‘�Ïf§ t = Wx+ µ+ � †PCA'�§�^̤©5?1êâ­ïž§ xn = W T (tn − t) tˆn = Wxn + t ¤±§Ä�þÏf©ÛŒ±ÀŠ3PCA�êâ­ïþV\˜‡D(‘" [2] 1.2.2 VÇ�.�Ú\ PPCAòëêz�VÇ©Ù�.�\PCA'…Ò´/ÏÛ�Cþ(Latent Variable)ÚFA�Vg§ Û�Cþ¢Ÿþƒ�uFA¥�$‘�Ïf"˜„/§b�Û�Cþ“Lpƒ���̶§ Ø�ˆ• 3 Ó5�: x ∼ N(0, I) � ∼ N(0, σ2I) l Œ±���©Cþt�^‡©Ùµ f(t|x;µ, σ,W ) = (2piσ2)−d/2exp { 1 2σ2 (t−Wx− µ)T (t−Wx− µ) } ∼ N(Wx+ µ, σ2I) d�VÇúª§��t�>�©Ùµ f(t;µ, σ,W ) = ∫ ∞ −∞ f(t|x;µ, σ,W )f(x)dx = (2pi)−d/2|C|−1/2exp { 1 2 (t− µ)TC−1(t− µ) } ∼ N(µ,C) Ù¥C = σ2I +WWT . ù�§ÏLÛ�Cþ�Ú\§¼� ëêz�VÇ©Ù�.§ëêW ,µ,σ2 1.2.3 ëê�O dub� Gaussian�.§Œq,�O�{Œ±¼�éëê��O"XJp‘êât´���§ †˜„�õ‘pd©ÙƒÓ§ÏL4Œzéêq,¼êŒ±��Xe�Oµ µ∗ = 1 N N∑ n=1 ti C∗ = S = 1 N N∑ n=1 (ti − µ∗)(ti − µ∗)T ?˜Ú§ŠâC = WWT + σ2I��WÚσ��Oµ WML = Uq(Λq − σ2I)1/2R σ2ML = 1 d− q d∑ j=q+1 λj Ù¥§Uq ∈ Rd×qd����Ý S�cq‡A�£�¤•þ|¤§éA�A�Š/¤é� Λq,R´? ¿˜‡��^=Ý " ¢SOŽž§‰½����Ý S§ÄkŒ±�O��σ£�d − q‡A�Š¤,? ��W �� O" 1.2.4 PPCA†PCA lþ¡�©Û±9����ëê�O(JŒ±wѧPPCA‰Ñ PCA�˜«�)ª�VÇ�. £ã"D(‘σ2 ��O(JdšÌ¤©éA�A�•þ|¤§^5ïþN��̤©˜m�›”� �§W��O¥§ªWÝ ��Ҵ̤©éA�•²LºÝC†Ú^=C†��" 4 1.3 PPCA�`³Þ~ òVÇ��.Ú\PCA¥§¦�éõÄuVÇ�.£q,¼ê¤�{±9�“dnاU Ð /�Ü�PCA¥§l ‘5 éõ¢SA^¥�`³" 1.3.1 ?n"”êâ ̤©©Û6u¤‰½�êâ§Ù©Û�(JéêâO(56éŒ"PPCAU )û3"” êâ�œ¹§=p‘êâtn = (tn1, · · · , tnd)¥3, ‘êêâ�"”"e¡{‡£ã^EMŽ{?n "”êâ�g´"33"”êâ�œ¹e§¦^EMŽ{U �OÑt¥"”�Ü©§Û�Cþx±9ë êσ, µ,W"d?=rN�©©z¥™²(‰Ñ�Ü©§äN�OŽúªë©z¥�N¹B"6§„e " ^EMŽ{?1�O§I‡¦^�e��VÇ©Ù�.µ t|x;µ, σ,W ∼ N(Wx+ µ, σ2I) x|t;W,σ2, µ ∼ N(M−1WT (t− µ), σ2M−1) M = WTW + σ2I f(t, x;µσ2,W ) = (2piσ2)−d/2exp { 1 2σ2 (t−Wx− µ)T (t−Wx− µ) } (2pi)−q/2exp { −1 2 xTx } 1.3.2 ?n·Ü�. w,§�©�PCA�.Ã{?n·Ü�.�œ¹§=êâŒU�)uØÓ�|O§ ØÓ�|O ŒUéAuØÓ�̤©"aqu?n"”êâ�{§ÏLEMŽ{§PPCAU �Ð/?n·Ü� .[4]"eã‰Ñ ˜‡éÐ�~f" 1.4 �( /ÏuÏf©ÛÚÛ�Cþ�Vg§PPCAòVÇ�µeÚ\ PCA§S¥"ÏL��)ª �ëêz�VÇ�.§òPCA¯KC¤ëê�O�¯K"/Ïuù˜�.§PPCAU ?n�¯K†� ©PCAƒ'ŒŒOõ" 1. ÏLÚ\VÇ©Ù§¦�NõÄuq,¼ê�ÚOEâU A^uPCA �(J?nÚ©Û¶ 2. #NÏL�“d�{§\\k�£§~X\\DÕ5��å¶[3] 3. �)ª��.¦�PPCAU {ü/ÏLEMŽ{?n"”êâÚ·Ü�.�œ¹. 5 §S6§ 1 PPCAµEMŽ{?n"”êâ Ñ\: "”��tn ∈ Rd, n = 1, · · · , N ÑÑ: ����tn ∈ Rd§Û�Cþxn ∈ Rq§ëêσ, µ,W 1: �Oµ µ∗j = 1 nj nj∑ k=1 tk(j) jL«1j‡|¤§=d®�êâ�OþŠ•þ�ˆ‡©þ 2: Щzµ‘ÅЩzt˜i, σ˜, W˜§¿��Û�Cþ�Щßÿ£Šâ��©Ù¤ x˜i = (W˜ T W˜ )−1W˜ (t˜− µ∗) 3: while S“ªŽ^‡Ø÷v do 4: E-step: 5: Šât�^‡©ÙW¿"”êâµ ti = Wxi + µ ∗ 6: Šâ��©Ùx|tOŽÛ�Cþx�Ï"µ < xi > = M −1WT (ti − µ∗) < xtx T i > = σ 2M−1+ < xi >< xi >T 7: M-step: 8: Šât, x�éÜVÇ©ÙÏLŒq,�OOŽëêW,σ 9: end while Figure 1: PPCA?n·Ü�.[2] 6 2 LDA 2.1 Úó LDA(Latent Dirichlet Allocation)´˜«�)ª�VÇ�.§�©Šö̇òÙA^u©�8�© Û§�ÙU 2$^uˆ«lÑêâ8¥" LDA�8�´ ‰˜‡êâ8£©�8¤˜‡{á�£ã§ÓžqU �3Ù¥Ä��ÚO& E§l U p�/^u�Y�©Û§~X©a!É~uÿ!ƒq5�ä�"Uì�©[5]�?n§d ?±©�©Û~`²LDA�Ä�g´"3©�?n¥§˜‡é­‡�¯K´ƒq5��ä§=J� эk|u©�©Û�A�"˜«'�{ü�{´OŽ©�¥üc�ƒq5§�´éõœ¹e§éa q�©� ¬¦^ØÓ�c®"±LDA“L�˜a{æ^�´,˜‡A�§=J�©��ÌK" Uì�)ª�.�g´§@¤k�©Ù��)L§)§Äk(½©Ù�ÌK§,�ŠâÌK±˜½ �VÇÀJ©Ù¥¤I‡¦^�üc"†˜„��)ª�.ƒ'§LDA´˜‡n��(�§=@©Ù �ÌKŒ±ï�˜‡�)ª�.§±˜½�VÇ�.�)§)¤�©�¥Œ±¹õ‡ÌK"e ã[6]‰Ñ ÏLù«�)ª��.�)˜‡©�8�/–�£ã" Figure 2: ©���)ª�. Ý �¹Âµz‡©�¥ˆ‡ücÑy�Vǧz‡ÌK¥ˆ‡üc�Vǧz‡©�¥ˆ‡ÌKÑy�VÇ �©�̇ë©z:[5] 2.2 LDA�. 2.2.1 ⊆ÎÒ æ^†�©ŠöƒÓ�⊆ÎÒµ • word: =©�¥�üc§½ölÑêâ8�Ä��|¤ü�"Ӟ§b½¤k�ücÑ5g 7 u˜‡�Ó�ücL{1, · · · , V }§z‡üc^•þ w L«§XJücÑy3ücL�1v‡ ˜§ Kwv = 1§ wu = 0, u 6= v¶ • document: =˜°©�§½ö`dN‡üc|¤�S�§^XeªL« w = (w1, · · · , wN ) • corpus: =©�8§dM‡©�|¤ D = (w1, · · · ,wM) LDA©Û�8�´é�˜«VÇ�.§Ø==U ¦�©�8¥�©�k�Œ�VÇ�)§Óžƒ q�©�U k�Œ�VÇÑy" 2.2.2 �)ª��. Äk§£ãü«'�{ü�Äu©�ÌK��)ª�." 1. Unigram Modelµ{ü��)ª�.§=¤k�©�¥¤k�ücÑÕáÓ©Ù/5guӘ ‡õ‘©Ù£Xã3¤«¤: p(w) = M∏ i=1 Ni∏ j=1 p(wij) 2. Mixture of unigrams µü��.§z‡©���)L§)üÚ§ÄkÀJ˜‡ÌKz§,� Äu^‡õ‘©ÙÕáÓ©Ù/�)N‡üc£Xã3¤«¤" p(w) = M∏ i=1 ∑ z p(z) Ni∏ n=1 p(wn|z) Figure 3: �)ª�."†µUnigram mµMixture of Unigram LDA�.´˜«E,�(�§æ^n��(�§#N©�±ØÓ�§Ý¹õ«ØÓ�ÌK§ 2\\˜�ÌK��)ª�." 8 2.2.3 LDA�. LDA�.ò©��ÌKÀÛ�Cþ§Óžq@Û�Cþ±˜½�VÇ�)§ƒ�uÛ�C þq\\˜«�“d�k�£ÀJ�k�©Ùõ‘©Ù��Ýk�Dirichlet©Ù¤" §S6§ 2 LDA�.�)©�8D¥�z‡©�w = (w1, · · · , wN ) 1: for z‡©� do 2: ÀJ©�5�N ∼ Possion(ξ) 3: ÀJÌK�VÇ©Ùθ ∼ Dir(α) 4: for éuT©���N‡ücwn do 5: (a) ÀJ˜‡ÌKzn ∼Multinomial(θ) 6: (b) ÀJ˜‡ücxn ∼Multinomial(wn|zn;β) 7: end for 8: end for 3þã�.¥§NÕáuÙ¦¤këê§éƒ��©ÛØ¬�)K§=˜9Ïþ§�¡�© Û¥¬�ÀّÅ5" e¡ò©n‡�gg?ØLDA�ˆ‡ëê£Cþ¤9VÇ�."£Xã4ØÓôÚ¤«¤ Figure 4: LDA�. 1. ©�8?O�ëêµα, β =éu¤k�©�уӧ�‡L§¥�)˜g"b�kk¥ÌK§Kαk•þ§Š Dirichlet©Ù�ëê^u�)ˆ‡©�ÌK�©Ùëê§βŠücæ�L§¥õ‘©Ù� ëê" 9 2. ©�?O�Cþ: θ =éuz‡©��¤kücуӧθ�©Ù´ëêα�Dirichlet©Ù§û½ z‡©��)ØÓ ÌK�VǧØÓ©�ƒmÕáө٧٩Ù/ªµ p(θ|α) = Γ( ∑k i=1 αi)∏k i=1 Γ(αi) θα1−11 · · · θαk−1k 3. üc?Oµz, w †ƒc�mixture of unigramØÓ§z´üc?O�Cþ§=z‡ücáu,«ÌKdθû½§z ‡ücÕáÓ©Ù/�)uÄuθ �õ‘©Ù p(zn|θ) = k∏ i=1 θ I(zn=k) k �(½ zn, βƒ�§ücwŒ±dõ‘©Ù�)§b�ücê8V p(wn|zn, β) = V∏ i=1 k∏ j=1 β I(zn=j,wn=i) ij u´§3‰½©�8?Oëêα, β�^‡e§Cþθ, z, w �©Ùµ p(θ, z, w|α, β) = p(θ|α) n∏ n=1 p(θn|θ)p(wn|zn, β) Ӟ§Œ±¼�üc�>�©Ù: p(w|α, β) = ∫ p(θ|α) ( N∏ n=1 ∑ zn p(zn|θ)p(wn|zn, β) ) dθ ±9�‡©�8�Vǵ P (D|α, β) = M∏ d=1 ∫ p(θd|α) ( Nd∏ n=1 ∑ znd p(znd|θ)p(wnd|znd, β) ) dθd e¡ò?˜Ú?ØÄuLDA�.�íäÚÆSL§" 2.2.4 ÄuLDA�íäÚëê�O d?{‡`²íäÚëê�O¯KŒU�{§Ø?ØêÆí�L§" ̇�íä¯K´3‰½©��^‡eOŽÛ�Cþθ, z���©Ù§Šâ�“dúªµ p(θ, z|w,α, β) = p(θ, z, w|α, β) p(w|α, β) °(ínA�J±��§Ì‡ÄCqín�{§MCMC´˜«Œ±æ^�ín{§Ì‡´Ä uDirichlet-Multinomial�Ý�Gibbs Sampling˜B[7]§[5]¥JÑ ˜«Äuà5�C©{" ëê�OL§Ì‡)éα, β��O§[5]ÑŒ±ÏLEM Ž{¢y" 10 2.2.5 A^†�( LDA´©�ï��˜‡éÐ��.§3êâ�÷Ú©�©Û�+¥ÑŒUkéÐ�A^"3˜„ �lÑêâ8¥§LDA�.ьU��éÐ�A^" 'uLDA�.��§±e�Ä�:Š�5¿µ 1. ٘Œ`³´æ^ÌK�.é©�?1©Û§†Äuücƒq5�©Ûƒ'§`³²w"Äk§Œ ±)ûõÂc�¯K§Ó˜‡c3Øӂ¸e�¹Âk¤ØӧӞӘ‡¹ÂŒ±^õ«cL «¶Ùg§ŒUüØ©�¥�D(�K§Ï©�¥�D( ¬3u˜ g‡�ÌK¥"ù «EâJ«·‚J�A�3ÅìÆS¥�­‡5§ ˜ Ė�A�U ¢y©a��Ÿ§� LuĖ�A�qéJJ�" 3LDA�.¥§U w�§éÌK�J�´ÃiÒ�§‡Jø Ôö��ÒU gÄÔöÑVÇ�©Ù" 2. æ^ õ�g��“d��)ª�."du¦^ Dirichlet-Multinomial�ݧ¦�Äu�“dn Ø�ínÚÆSÑØ´LuE,"ù«õ�g��)ª�.ŒUU‡Ný¢��)L§§XJ� .b��(§ U 3Jø���Ôö���^‡e§¼�'�Ð�ÆSÚín�J" 3 o( �)ª�.3é*ÿêâï�ž§Ï~Ѭb½˜ Û��Cþ§¿…‰ÑÛ�CþÚ*ÿêâ� éÜ©Ù§Šâ˜ ^‡Õá5'X§¿|^�“dín�{?1íäÚÆS"XJ�O��)ª� .U �Ð/Cqý¢�©Ù§T�. Uw«éÐ��J" �©{‡Vã ü«ÄuÛ�Cþ(Latent Variables)��)ª�." 1. PPCA(Probabilistic PCA)§ÏLÚ\ƒp���$‘˜m�pdÛ�Cþ§ÓžqD(‘L«g ‡�¤©�{§òVÇ�.Ú\̤©©Û¥§¼�p‘êâÚÛ�Cþ�éÜ©Ù§l U ¦^Œq,�O!EMŽ{�?n˜ Ä�PCA{J±?n�óŠ" 2. LDA(Latent Dirichlet Allocation)§�ï ˜‡n���“d�."3©�©Û¥§z‡ücéA ˜‡Û�Cþz§ z‡©�qéAu˜‡Û�Cþ觩��Û�Cþû½©�¥ÌK�©Ù§ üc�Û�Cþû½ TücéA�ÌK" 11 References [1] Michael E Tipping and Christopher M Bishop. Probabilistic principal component analysis. Journal of the Royal Statistical Society, Series B, 61(3): 611-622. [2] http://www.cmlab.csie.ntu.edu.tw/ cyy/learning/tutorials/PCA.pdf [3] Guan Y, Dy J G. Sparse probabilistic principal component analysis[C]//International Conference on Artificial Intelligence and Statistics. 2009: 185-192. [4] Tipping M E, Bishop C M. Mixtures of probabilistic principal component analyzers[J]. Neural com- putation, 1999, 11(2): 443-482. [5] David M Bei, Andrew Y Ng and Michael I Jordan. Latent Dirichlet allocation. Journal of Machine Learning Research 2003, 3: 993-1022. [6] http://blog.csdn.net/huagong adu/article/details/7937616 [7] http://en.wikipedia.org/wiki/Latent Dirichlet allocation 12 1 PPCA 1.1 ÒýÑÔ 1.2 PPCAÄ£ÐÍ 1.2.1 Òò×Ó·ÖÎöÓëPCA 1.2.2 ¸ÅÂÊÄ£Ð͵ÄÒýÈë 1.2.3 ²ÎÊý¹À¼Æ 1.2.4 PPCAÓëPCA 1.3 PPCAµÄÓÅÊƾÙÀý 1.3.1 ´¦ÀíȱʧÊý¾Ý 1.3.2 ´¦Àí»ìºÏÄ£ÐÍ 1.4 С½á 2 LDA 2.1 ÒýÑÔ 2.2 LDAÄ£ÐÍ 2.2.1 ÊõÓïÓë·ûºÅ 2.2.2 ²úÉúʽµÄÄ£ÐÍ 2.2.3 LDAÄ£ÐÍ 2.2.4 »ùÓÚLDAµÄÍƶϺͲÎÊý¹À¼Æ 2.2.5 Ó¦ÓÃÓëС½á 3 ×ܽá
/
本文档为【Lm】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索