《语言信息处理》作业参考
1
《语言信息处理》作业参考
一、第一次作业
2.举出下面句子中所包含的一些语法要素,例如单语素词、双语素词,不同类型的短语等等;另
外请举出该句中一些短语之间嵌套的例子。
人声逐渐渺茫,像睡梦里所听到的芦花枕头里的窸窣。
答:
单语素词:逐渐、渺茫、像、里、所、的、窸窣
双语素词:人声、睡梦、听到、芦花、枕头
短语:逐渐渺茫(修饰或动词性短语中的状中短语)、人声逐渐渺茫(陈述或动词性短语中的主
谓短语)、睡梦里(名词性短语中的方位短语)、芦花枕头(修饰或名词性短语中的定中短语)、...
1
《语言信息处理》作业参考
一、第一次作业
2.举出下面句子中所包含的一些语法要素,例如单语素词、双语素词,不同类型的短语等等;另
外请举出该句中一些短语之间嵌套的例子。
人声逐渐渺茫,像睡梦里所听到的芦花枕头里的窸窣。
答:
单语素词:逐渐、渺茫、像、里、所、的、窸窣
双语素词:人声、睡梦、听到、芦花、枕头
短语:逐渐渺茫(修饰或动词性短语中的状中短语)、人声逐渐渺茫(陈述或动词性短语中的主
谓短语)、睡梦里(名词性短语中的方位短语)、芦花枕头(修饰或名词性短语中的定中短语)、
芦花枕头里的窸窣(修饰或名词性短语中的定中短语)、所听到的芦花枕头里的窸窣(名词性短
语中的所字短语)、像睡梦里所听到的芦花枕头里的窸窣(支配或动词性短语中的述宾短语)
短语嵌套:[人声[逐渐渺茫]](主谓结构短语嵌套状中短语),[[[芦花枕头]里]的窸窣](定中
结构短语嵌套方位短语,方位短语中嵌套定中短语)。
3. 哪儿去了?
什么哪儿去了?
你说什么哪儿去了?
我哪儿知道你说什么哪儿去了?
你怎么会不知道我说什么哪儿去了?
你怎么知道我一定知道你说什么哪儿去了?
这段话主要体现了语法或者句法的什么特点,试着用结构化的方式描述这一特点(例如使用类似于
“主-谓-宾”这样的结构表达方式)。
答:该段文字主要体现了自然语言句法的生成性。
哪儿去了[(主)-谓-宾]
什么哪儿去了:[主-谓-宾]
你说什么哪儿去了:[主-谓-[主-谓-宾]]
我哪儿知道你说什么哪儿去了:[主-谓-[主-谓-[主-谓-宾]]]
你怎么会不知道我说什么哪儿去了:[主-谓-[(主)-谓-[主-谓-[主-谓-宾]]]]
你怎么知道我一定知道你说什么哪儿去了:[主-谓-[主-谓-[主-谓-[主-谓-宾]]]]
(上述表达中的圆括号表示成分的省略)
4.指出词“reformations”的词干、词根、词缀和词尾,该词使用了哪些构词
?
答:
词干:reformation
词根:form
词缀:re- -ation
词尾:-s
该词使用了构形法(词干和词尾的结合)和派生法构词(词根和词缀的结合)。
2
6.用逻辑形式表示出句子 George ate a pizza at every road stop所有可能的解释,并用准逻辑形式表
达这一歧义。
答:
逻辑形式:
(EVERY r1: (ROAD STOP1 r1) (A p1: (PIZZA1 p1) (PAST (EAT1 (NAME g1 “George”) p1))))
(A p1: (PIZZA1 p1) (EVERY r1: (ROAD STOP1 r1) (PAST (EAT1 (NAME g1 “George”) p1))))
准逻辑形式:
(
(NAME g1 “George”) )
二、第二次作业:
1.给定表 1、表 2,
表 1:Brown语料库中一些标记转移的理想计数。例如,NN在 AT后面出现了 48,636次。
AT BEZ IN NN VB PERIOD
AT 0 0 0 48,636 0 19
BEZ 1,973 0 426 187 0 38
IN 43,322 0 1,325 17,314 0 185
NN 1,067 3,720 42,470 11,773 614 21,392
VB 6,072 42 4,758 1,476 129 1,522
PERIOD 8,016 75 4,656 1,329 954 0
表 2:Brown 语料库中一些词和标记同时出现的理想计数。例如,move 被标注成 NN 一共出现了
36次。
AT BEZ IN NN VB PERIOD
bear 0 0 0 10 43 0
is 0 10,065 0 0 0 0
move 0 0 0 36 133 0
on 0 0 5,484 0 0 0
president 0 0 0 382 0 0
progress 0 0 0 108 4 0
the 69,016 0 0 0 0 0
0 0 0 0 0 48,809
(1) 计算下列概率:
( )move on the isbear TheNNATINBEZNNATP
( )move on the isbear TheVBATINBEZNNATP
其中, ( ) 101 =ttP
3
解:根据贝叶斯公式可得:
( ) ( ) ( )( )WP
TPTWP
WTP =
根据以下两个假设:(1)词性的二元语法模型;(2)词的出现只和它的词性有关(词与词之间
相互独立),
词性标注的统计模型 ( ) ( )TPTWP 可简化为:
( ) ( ) ( ) ( )( )Õ
=
-´=
n
i
iiii ttPtwPTPTWP
1
1
根据最大似然估计:
( ) ( )( )
( )
( ) ( )
( )
( )
( )
( )åå =
==
=
==
-
-
-
-
-
c
ii
ii
i
ii
ii
v
ii
ii
i
ii
ii cttC
ttC
tC
ttCttP
vwtC
twC
tC
twCtwP
,
,,
,
,,
1
1
1
1
1
查共现表得:
( )
( ) ( ) ( )( )
( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( )
( )
( )
6
0
6
1
1
1050.61
48655
48636
62146
43322
2624
426
81036
3720
48655
486361
536
36111
536
1011
1948636
48636
18517314132543322
43322
381874261973
426
21392614117734247037201067
3720
1948636
486361
1083823610
36
69016
69016
5484
5484
10065
10065
1083823610
10
69016
690161
movetheonisbearThe
move on the isbear The
1
1
move on the isbear The
-
=
-
´´=
´´´´´´´´´´´´=
+
´
+++
´
+++
´
+++++
´
+
´
´
+++
´´´´
+++
´´=
=
´´= Õ
WP
WP
WP
ATNNPINATPBEZINPNNBEZPATNNPtATP
NNPATPINPBEZPNNPATP
P
ttPtwP
WP
NNATINBEZNNATP
i
iiii
同理,
( )
( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( )
( )WP
WP
ATVBPINATPBEZINPNNBEZPATNNPtATP
VBPATPINPBEZPNNPATP
P
VBATINBEZNNATP
0
48655
0
62146
43322
2624
426
81036
3720
48655
486361
536
36111
536
4311
movetheonisbearThe
move on the isbear The
1
move on the isbear The
0
=
´´´´´´´´´´´´=
=
4
2 给出词串“许多 朋友 送来 的 礼物”的 Chart分析,以及最后得到的句法树(所有可能的结
果)。
规则: 词典
S → NP VP 许多:J
NP → ADJP NP 朋友:N
NP → CP NP 送来:V
CP → S De 的:De
ADJP → J 礼物:N
NP → N
VP → V
解:
日程、活动边表:
Agenda Active arc Chart
1.J(1,2) 2.ADJP →J•(1,2) 3.J(1,2)
4.ADJP(1,2) 5.NP →ADJP•NP(1,2) 6.ADJP(1,2)
7.N(2,3) 8.NP →N•(2,3) 9.N(2,3)
10.NP(2,3) 11.S →NP•VP(2,3) 12.NP(2,3)
13.NP →ADJP NP• (1,3)
14.NP(1,3) 15.S →NP•VP(1,3) 16.NP(1,3)
17.V(3,4) 18.VP →V•(3,4) 19.V(3,4)
20.VP(3,4) 21.VP(3,4)
22.S →NP VP• (1,4)
23.S(1,4) 24.CP →S•De(1,4) 25.S(1,4)
26.De(4,5) 27.De(4,5)
28.CP →S De• (1,5)
29.CP(1,5) 30.NP →CP•NP(1,5) 31.CP(1,5)
32.N(5,6) 33.NP →N•(5,6) 34.N(5,6)
35.NP(5,6) 36.S →NP•VP(5,6) 37.NP(5,6)
38.NP →CP NP• (1,6)
39.NP(1,6) 40.NP(1,6)
41.V(3,4) 42.VP →V•(3,4) 43.V(3,4)
44.VP(3,4) 45.VP(3,4)
46.S →NP VP• (2,4)
47.S(2,4) 48.CP →S•De(2,4) 49.S(2,4)
50.De(4,5) 51.De(4,5)
52.CP →S De• (2,5)
53.CP(2,5) 54.NP →CP•NP(2,5) 55.CP(2,5)
56.NP(5,6) 57.S →NP•VP(5,6) 58.NP(5,6)
59.NP →CP NP• (2,6)
60.NP(2,6) 61.NP →ADJP NP• (1,6) 62.NP(2,6)
1 2 3 4 5 6
许多 朋友 送来 的 礼物
J N V De N
5
63.NP(1,6) 64.NP(1,6)
Chart图表示的分析流程,红色表示未完整匹配的规则和边:
最终得到的 Chart图(可由日程、活动边表的 Chart列得出):
得到的可能的短语结构树:
1 2 3 4 5 6
许多 朋友 送来 的 礼物
J N V De N
ADJP NP
NP
VP
S
CP
NP
NP
S
CP
NP
NP
最终的 Chart图
1 2 3 4 5 6
许多 朋友 送来 的 礼物
J N V De N
ADJP→J• NP→N•
NP→ADJP NP•
NP→ADJP•NP S→NP•VP
S→NP•VP
VP→V•
S→NP VP•
CP→S•De
CP→S De•
NP→N•
NP→CP•NP
NP→CP NP•
S→NP VP•
CP→S•De
CP→S De•
NP→CP•NP
NP→CP NP•
NP→ADJP NP•
6
3.已知依存结构:
分别给出使用 Yamada的Multi-pass算法、Nivre的 Arc-standard算法和 Arc-eager算法的分析动
作序列。
解:
Yamada的Multi-pass算法:Pass1: Left→Right→Shift→Shift→Shift→Right→Left
Pass2: Left
Nivre的 Arc-standard算法:Right-Reduce→Shift→Left-Reduce→Shift→Shift→Shift→Left-Reduce
→Right-Reduce→Right-Reduce
Nivre 的 Arc-eager 算法:Right-Arc→Reduce→Left-Arc→Shift→Right-Arc→Shift→Left-Arc→
Right-Arc→Reduce→Reduce
a b c d e f
NP
CP
NP ADJP
J
许多 De
朋友
S
VP
V
送来
NP
N
的
NP
礼物
N
CP
NP
ADJP
J
许多
De
朋友
S
VP
V
送来
NP
N
的
NP
礼物
N
NP
本文档为【《语言信息处理》作业参考】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。