为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

《语言信息处理》作业参考

2011-10-11 6页 pdf 129KB 24阅读

用户头像

is_795990

暂无简介

举报
《语言信息处理》作业参考 1 《语言信息处理》作业参考 一、第一次作业 2.举出下面句子中所包含的一些语法要素,例如单语素词、双语素词,不同类型的短语等等;另 外请举出该句中一些短语之间嵌套的例子。 人声逐渐渺茫,像睡梦里所听到的芦花枕头里的窸窣。 答: 单语素词:逐渐、渺茫、像、里、所、的、窸窣 双语素词:人声、睡梦、听到、芦花、枕头 短语:逐渐渺茫(修饰或动词性短语中的状中短语)、人声逐渐渺茫(陈述或动词性短语中的主 谓短语)、睡梦里(名词性短语中的方位短语)、芦花枕头(修饰或名词性短语中的定中短语)、...
《语言信息处理》作业参考
1 《语言信息处理》作业参考 一、第一次作业 2.举出下面句子中所包含的一些语法要素,例如单语素词、双语素词,不同类型的短语等等;另 外请举出该句中一些短语之间嵌套的例子。 人声逐渐渺茫,像睡梦里所听到的芦花枕头里的窸窣。 答: 单语素词:逐渐、渺茫、像、里、所、的、窸窣 双语素词:人声、睡梦、听到、芦花、枕头 短语:逐渐渺茫(修饰或动词性短语中的状中短语)、人声逐渐渺茫(陈述或动词性短语中的主 谓短语)、睡梦里(名词性短语中的方位短语)、芦花枕头(修饰或名词性短语中的定中短语)、 芦花枕头里的窸窣(修饰或名词性短语中的定中短语)、所听到的芦花枕头里的窸窣(名词性短 语中的所字短语)、像睡梦里所听到的芦花枕头里的窸窣(支配或动词性短语中的述宾短语) 短语嵌套:[人声[逐渐渺茫]](主谓结构短语嵌套状中短语),[[[芦花枕头]里]的窸窣](定中 结构短语嵌套方位短语,方位短语中嵌套定中短语)。 3. 哪儿去了? 什么哪儿去了? 你说什么哪儿去了? 我哪儿知道你说什么哪儿去了? 你怎么会不知道我说什么哪儿去了? 你怎么知道我一定知道你说什么哪儿去了? 这段话主要体现了语法或者句法的什么特点,试着用结构化的方式描述这一特点(例如使用类似于 “主-谓-宾”这样的结构表达方式)。 答:该段文字主要体现了自然语言句法的生成性。 哪儿去了[(主)-谓-宾] 什么哪儿去了:[主-谓-宾] 你说什么哪儿去了:[主-谓-[主-谓-宾]] 我哪儿知道你说什么哪儿去了:[主-谓-[主-谓-[主-谓-宾]]] 你怎么会不知道我说什么哪儿去了:[主-谓-[(主)-谓-[主-谓-[主-谓-宾]]]] 你怎么知道我一定知道你说什么哪儿去了:[主-谓-[主-谓-[主-谓-[主-谓-宾]]]] (上述表达中的圆括号表示成分的省略) 4.指出词“reformations”的词干、词根、词缀和词尾,该词使用了哪些构词? 答: 词干:reformation 词根:form 词缀:re- -ation 词尾:-s 该词使用了构形法(词干和词尾的结合)和派生法构词(词根和词缀的结合)。 2 6.用逻辑形式表示出句子 George ate a pizza at every road stop所有可能的解释,并用准逻辑形式表 达这一歧义。 答: 逻辑形式: (EVERY r1: (ROAD STOP1 r1) (A p1: (PIZZA1 p1) (PAST (EAT1 (NAME g1 “George”) p1)))) (A p1: (PIZZA1 p1) (EVERY r1: (ROAD STOP1 r1) (PAST (EAT1 (NAME g1 “George”) p1)))) 准逻辑形式: ( (NAME g1 “George”) ) 二、第二次作业: 1.给定表 1、表 2, 表 1:Brown语料库中一些标记转移的理想计数。例如,NN在 AT后面出现了 48,636次。 AT BEZ IN NN VB PERIOD AT 0 0 0 48,636 0 19 BEZ 1,973 0 426 187 0 38 IN 43,322 0 1,325 17,314 0 185 NN 1,067 3,720 42,470 11,773 614 21,392 VB 6,072 42 4,758 1,476 129 1,522 PERIOD 8,016 75 4,656 1,329 954 0 表 2:Brown 语料库中一些词和标记同时出现的理想计数。例如,move 被标注成 NN 一共出现了 36次。 AT BEZ IN NN VB PERIOD bear 0 0 0 10 43 0 is 0 10,065 0 0 0 0 move 0 0 0 36 133 0 on 0 0 5,484 0 0 0 president 0 0 0 382 0 0 progress 0 0 0 108 4 0 the 69,016 0 0 0 0 0 0 0 0 0 0 48,809 (1) 计算下列概率: ( )move on the isbear TheNNATINBEZNNATP ( )move on the isbear TheVBATINBEZNNATP 其中, ( ) 101 =ttP 3 解:根据贝叶斯公式可得: ( ) ( ) ( )( )WP TPTWP WTP = 根据以下两个假设:(1)词性的二元语法模型;(2)词的出现只和它的词性有关(词与词之间 相互独立), 词性标注的统计模型 ( ) ( )TPTWP 可简化为: ( ) ( ) ( ) ( )( )Õ = -´= n i iiii ttPtwPTPTWP 1 1 根据最大似然估计: ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )åå = == = == - - - - - c ii ii i ii ii v ii ii i ii ii cttC ttC tC ttCttP vwtC twC tC twCtwP , ,, , ,, 1 1 1 1 1 查共现表得: ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 6 0 6 1 1 1050.61 48655 48636 62146 43322 2624 426 81036 3720 48655 486361 536 36111 536 1011 1948636 48636 18517314132543322 43322 381874261973 426 21392614117734247037201067 3720 1948636 486361 1083823610 36 69016 69016 5484 5484 10065 10065 1083823610 10 69016 690161 movetheonisbearThe move on the isbear The 1 1 move on the isbear The - = - ´´= ´´´´´´´´´´´´= + ´ +++ ´ +++ ´ +++++ ´ + ´ ´ +++ ´´´´ +++ ´´= = ´´= Õ WP WP WP ATNNPINATPBEZINPNNBEZPATNNPtATP NNPATPINPBEZPNNPATP P ttPtwP WP NNATINBEZNNATP i iiii 同理, ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )WP WP ATVBPINATPBEZINPNNBEZPATNNPtATP VBPATPINPBEZPNNPATP P VBATINBEZNNATP 0 48655 0 62146 43322 2624 426 81036 3720 48655 486361 536 36111 536 4311 movetheonisbearThe move on the isbear The 1 move on the isbear The 0 = ´´´´´´´´´´´´= = 4 2 给出词串“许多 朋友 送来 的 礼物”的 Chart分析,以及最后得到的句法树(所有可能的结 果)。 规则: 词典 S → NP VP 许多:J NP → ADJP NP 朋友:N NP → CP NP 送来:V CP → S De 的:De ADJP → J 礼物:N NP → N VP → V 解: 日程、活动边表: Agenda Active arc Chart 1.J(1,2) 2.ADJP →J•(1,2) 3.J(1,2) 4.ADJP(1,2) 5.NP →ADJP•NP(1,2) 6.ADJP(1,2) 7.N(2,3) 8.NP →N•(2,3) 9.N(2,3) 10.NP(2,3) 11.S →NP•VP(2,3) 12.NP(2,3) 13.NP →ADJP NP• (1,3) 14.NP(1,3) 15.S →NP•VP(1,3) 16.NP(1,3) 17.V(3,4) 18.VP →V•(3,4) 19.V(3,4) 20.VP(3,4) 21.VP(3,4) 22.S →NP VP• (1,4) 23.S(1,4) 24.CP →S•De(1,4) 25.S(1,4) 26.De(4,5) 27.De(4,5) 28.CP →S De• (1,5) 29.CP(1,5) 30.NP →CP•NP(1,5) 31.CP(1,5) 32.N(5,6) 33.NP →N•(5,6) 34.N(5,6) 35.NP(5,6) 36.S →NP•VP(5,6) 37.NP(5,6) 38.NP →CP NP• (1,6) 39.NP(1,6) 40.NP(1,6) 41.V(3,4) 42.VP →V•(3,4) 43.V(3,4) 44.VP(3,4) 45.VP(3,4) 46.S →NP VP• (2,4) 47.S(2,4) 48.CP →S•De(2,4) 49.S(2,4) 50.De(4,5) 51.De(4,5) 52.CP →S De• (2,5) 53.CP(2,5) 54.NP →CP•NP(2,5) 55.CP(2,5) 56.NP(5,6) 57.S →NP•VP(5,6) 58.NP(5,6) 59.NP →CP NP• (2,6) 60.NP(2,6) 61.NP →ADJP NP• (1,6) 62.NP(2,6) 1 2 3 4 5 6 许多 朋友 送来 的 礼物 J N V De N 5 63.NP(1,6) 64.NP(1,6) Chart图表示的分析流程,红色表示未完整匹配的规则和边: 最终得到的 Chart图(可由日程、活动边表的 Chart列得出): 得到的可能的短语结构树: 1 2 3 4 5 6 许多 朋友 送来 的 礼物 J N V De N ADJP NP NP VP S CP NP NP S CP NP NP 最终的 Chart图 1 2 3 4 5 6 许多 朋友 送来 的 礼物 J N V De N ADJP→J• NP→N• NP→ADJP NP• NP→ADJP•NP S→NP•VP S→NP•VP VP→V• S→NP VP• CP→S•De CP→S De• NP→N• NP→CP•NP NP→CP NP• S→NP VP• CP→S•De CP→S De• NP→CP•NP NP→CP NP• NP→ADJP NP• 6 3.已知依存结构: 分别给出使用 Yamada的Multi-pass算法、Nivre的 Arc-standard算法和 Arc-eager算法的分析动 作序列。 解: Yamada的Multi-pass算法:Pass1: Left→Right→Shift→Shift→Shift→Right→Left Pass2: Left Nivre的 Arc-standard算法:Right-Reduce→Shift→Left-Reduce→Shift→Shift→Shift→Left-Reduce →Right-Reduce→Right-Reduce Nivre 的 Arc-eager 算法:Right-Arc→Reduce→Left-Arc→Shift→Right-Arc→Shift→Left-Arc→ Right-Arc→Reduce→Reduce a b c d e f NP CP NP ADJP J 许多 De 朋友 S VP V 送来 NP N 的 NP 礼物 N CP NP ADJP J 许多 De 朋友 S VP V 送来 NP N 的 NP 礼物 N NP
/
本文档为【《语言信息处理》作业参考】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索