跟副词!也"有关的偏误分析
北京语言学院 陈小荷
#$%&’()& *+,-./012345,645-457489::,-4255;114+54/2<,-498=41>也 ?9:/2@.+9
5210;/2<2+4A.::.2+B-.+4/45-9195,41/61.,,4+>C2=41/49//,;84+,/D9+8E12;048,-4
41121/.+,2<2;1,C04/FG49,,4A0,,28./52=41,-452+,4H,;9:52+8.,.2+/.+6-.5-,-441I
121/255;19+8A9749/,9,./,.59:9+9:C/./2<,-4;/419,49+8,-44112119,4FJ;1A9.+
52+5:;/.2+/914K?L@,-452+,4H,;9:9+9:C/./59+84:.A.,,-4/52042<,-441121/M?N@,-4
;/419,49+8,-44112119,4914E19=4:C9<<45,48>C,-4/,;84+,/O+9,.=4:9+E;9E4/9+8,-4
,4H,,C04/D,-45:9//-2;1/-9=414A9179>:4.+<:;4+542+,-4;/419,4>;,-9=4:.,,:4.+I
<:;4+542+,-44112119,4F
L 引言
关于副词!也"的偏误分析D不少著作
有所涉及D佟慧君?LPQR@讨论较为详细S但
是我们很想知道D在较大规模的留学生汉
语语料中D副词!也"的使用情况如何D包
括K?一@使用率M?二@偏误率M?三@从汉语
语法结构上看D偏误的主要原因是什么M
?四@使用率和偏误率跟哪些语篇属性有
关S
我们使用的是北京语言学院 BBT*U中
经抽样和词性标注的核心语料D约有LVV万
字DWXXQRN词次S该语料库的每一篇语料
都录有较详细的语篇属性D便于我们对所
研究的语言问题作背景分析S由于已标注
词性D因此不仅容易检索副词!也"D而且可
以粗选出可能有偏误的句子S
我们从语料中检索出副词!也"XXYR
例D拿这个数除以总词次D就得到!也"的使
用 率SZ BBT*中D!也"的 使 用 率 为 VF
YXVYQ[D而在\现代汉语频率词典]中D
!也"的使用率为VFWXN^Q[D两相比较D
BBT*中!也"的使用率明显偏高D这暗示可
能有较多的误代和滥用S
本文在引用该语料库的例句时一律不
作任何修改S这样做会有一些副作用D如例
句中出现别的偏误时容易转移注意力D但
是为了能观察到真实的上下文D对所要研
究的问题作较准确的语境分析D这样做还
是有必要的S另外D我们不仅要研究误例D
也要研究正例D以便相互比较D找出问题的
关键S这里所说的!正例"D就是指该语料库
中在副词!也"的使用上没有偏误的例子D
并不排除它在别的方面可能存在偏误S
N 语境分析
NFL我们从XXYR例中发现跟副词!也"
有关的偏误XNQ例D可分为四种类型K
甲类 !也"在主语前D例如K
?L@_ 课堂里也他表现得很突出S
?N@_ 即使我来过中国几次也我没生
活过这么长时间S
?X@_ 有的时候我给他电话D也他给
我S
乙类 !也"跟其他状语位置不对D例
如K
XW
世界汉语教学LPPY年第N期?总第XY期@
!"#$ 我也刚才在那边找过半天%
!$ 我们日本人也当然重视电器的
质量’可是比不上中国人%(
丙类 作为周遍性主语的偏正结构
被)也*分开’例如+
!,#$ 他的脑子转得快’什么也知道
汉字的事’知识渊博的人%
!-#$ 他有一点儿善良’但是一点也
没有理解力%
丁类 )也*的误代和滥用’例如+
!.#$ 我今天也又跟她见面了%
!/#$ 他们低着声对我说几句骂人的
话’也说希望主人把这位脏东西扔出去%
!01#$ 我忘不了我国家’我父亲’母
亲’也我的朋友们%
!00#$ 一个古老的苦刑也是让犯人
喝得太多%
以上例!.#中)也*多余’例!/#的)也*
应为)还*’例!01#的)也*应为)和*’例!00#
的)也*应为)就*%
232如果用)也*的误例个数与)也*的
用例个数之比作为偏误率’则总计偏误率
为42.544,-6/3-"78在全部误例当中’这
四类偏误所占比例为+
甲类 4-例 0032.7
乙类 41例 /30&7
丙类 2,例 -3/47
丁类 24&例 -03,&7
丁类所占比例最大’情况也最为复杂%
我们注意到’误代的例子中’主要是该用
)还*9)和*9)就*时用了)也*%由此可以猜
想’如果没有别的因素’或者别的因素影响
不大’那么::;<中)还*9)和*9)就*的使用
率会偏低%从以下数据来看’事实正是如
此+=
::;< 现代汉语频率词典
也 44,-例’13,41,.7 ,///例’13&42".7
还 0"&.例’132-41/7 &40.例’13"1"&/7
和 2.,-例’13&4-127 /04.例’13,/&227
就 2&,1例’13"-/&27 0101-例’13-,./"7
234我们对前三类语序偏误特别感兴
趣%总的来看’)也*的语序偏误不是很多%
这就产生一个问题+为什么绝大多数句子
中)也*不发生语序偏误’偏偏这些句子发
生)也*的语序偏误呢>我们想从语境即
)也*的上下文!有时也涉及含)也*的句子
的上下文#来找原因%具体地说’我们要确
定发生)也*的某类语序偏误的语境条件’
使得偏误发生率!符合某些语境条件时’发
生特定语序偏误的概率#和偏误覆盖率!已
发生特定语序偏误’符合这些语境条件的
概率#都尽可能高%显然’偏误发生率跟偏
误覆盖率是一对矛盾+语境条件定得严’发
生率高而覆盖率低8语境条件定得松’则发
生率低而覆盖率高%我们处理这一矛盾的
原则是’语境条件的确定要有句法上的根
据%
23"我们观察了甲类偏误的句子’发
现这些句子通常是以下两种情况+
第一’复句的后一分句有主语’而且除
了)也*以外’没有其他关联词语%如例!2#
和!4#’再如+
!02#$ 这个的原因是语法不对的说
话也一般人听懂我的意思%
!04#$ 我们在一起想’有什么事情都
会解决的’或者只是在一起谈话也心里的
压力就放松多了%
!0"#$ 我的朋友的身体好也我们的
国家好%
!0$ 在上星期六早上七点半我一
起床要准备去玩儿就发现外边的天气不好
刮大风也温度比较低%
如果有其他关联词语’)也*一般不会
误置主语前’例如+
!0,#可能我们应该很挑剔的选择朋
友’反过来说我们也应该珍惜人们的友谊%
!0-#我们怎么查看也不行’然后汽车
"&
世界汉语教学0//,年第2期!总第4,期#
也开不动了!
第二"单句以话题#状语或受事主语等
开头"然后出现$也%和主语或小主语"如例
&’("再如)
&’*(+ 这个时候也她比我有劲儿"又
开始想想怎么走好呢,
&’-(+ 这个也我觉得很有意思!
&./(+ 这武装警察也我无条件地选
择!0
&.’(+ 芳华和志英也关系好了!
在单句中如果不以话题#状语开头"也
不同时出现大主语和小主语"一般不会产
生甲类语序偏误!例如)
&..(你也去吧!
&.1(我们两儿也算心服眼服"能亲自
享受到万里长城的微妙!
当然"不能说有了上述语境条件就一
定会发生甲类语序偏误!据我们统计"符合
上述语境条件的句子有21/个"发生甲类语
序偏误的13个"频率是*41567不符合这种
语境条件而发生甲类语序偏误的句子.个)
&.2(+ 也好多姑娘被他杀死了!
&.8(+ 也我首先可理解每个国家的
传统!
例&.2(前面一句是$好多天过了!%所
以如果不拘泥于标点"也可以认为&.2(是
复句的后一分句!例&.8(前面也有句子!总
之"我们还没发现段落起始句有以$也%开
头的!
从句法研究的角度看"甲类语序偏误
给我们一个重要启发!通常说"主谓谓语句
是汉语的一种特殊句型"大主语和小主语
之间可以插入副词!但是"大小主语之间插
入副词是有很复杂的条件的!首先"作谓语
的主谓结构应该结合得比较紧密"例&.’(
如果把$关系好了%改成$关系不错%"可接
受性就强多了!其次"有没有对比也不一
样"例&’8($也温度比较低%是错的"但是如
果出现在$太原温度不高"北京也温度比较
低%里就不能算错!
再其次"如果大主语是话题&’-(或受
事&./("副词一般也不插在大小主语之间!
最后"如果把句首的时间词#处所词也看成
主语"那么大小主语之间能否插入副词的
问题就更复杂了"所以句首的时间词#处所
词最好还是看成状语!
.48乙类语序偏误主要是两种情况)
第一"$也%和时间词语的位置不对"如
例&2("再如)
&.3(+ 现在也有时候回忆它!
&.5(+ 我也这时候经常跟父母顶嘴"
心里总是不开心!
&.*(+ 我也以前常骑自行车了!
第二"$也%和语气副词的位置不对"如
例&8("再如)
&.-(+ 但这时候还是夜里"大家都想
睡觉"我们也当然想休息!
&1/(+ 我是个男孩子"对于我来说"
女朋友也当然很重要!
有趣的是"这个语气副词通常是$当
然%!如果在词语例释时顺便出一个含有
$当然%和$也%的例句"对预防这种偏误可
能会有作用!
因此我们把语境条件划定为)句子中
同时出现$也%和时间词语9语气副词"先后
顺序不论!符合这种语境条件的句子有’11
个"发生乙类语序偏误的.-个"频率是.’4
*/67不符合这种语境条件而发生乙类语
序偏误的句子’个)
&1’(+ 很正常的事也按自己的观点
看中的是不正常!
关于多项状语的顺序"刘月华&’-*1(
作了细致的分析"但是讨论到$也%时"没有
提$也%跟语气副词的关系7至于$也%跟时
间词语的关系"也只是说两种顺序都可以"
需依语境而定!我们认为"从$也%的使用来
88
世界汉语教学’--3年第.期&总第13期(
看!时间词语应分为两种!一种是体词性
的!即时间词或相当于时间词的短语!如"
#刚才$以前$这时候$那时候$有时候$%
的时候&一般放在#也&的前面’另一种是表
时间或频率的副词!如"#常常$经常$时常$
时而&一般放在#也&的后面(
)*+丙类的#也&本身没有语序偏误!
但正是由于使用#也&而把偏正结构分开(
如例,+-$,.-!又如"
,/)-0 但是我什么也不知道中国的
情况(
,//-0 大家带着这个手表游泳!什么
也没问题(
,/1-0 一平方米也没有空的地方(
发生丙类语序偏误的语境条件包括"
第一!是周遍性主语句’第二!这个主语可
以用一个偏正结构来表达’第三!句子的动
词必须是及物动词(据统计!符合这种语境
条件的句子2//个!发生丙类语序偏误的)+
个!频率是23*445’不符合这种语境条件
而发生丙类语序偏误的句子没发现(
丙类语序偏误很少有人提及(这种语
序偏误有多种修改办法可供选择!一是用
偏正结构作周遍性主语!如,//-可修改为"
,//6-大家戴着这个手表游泳!什么问
题也没有(
二是把宾语提前作为话题!如,/)-可修改
为"
,/)6-但是中国的情况我什么也不知
道(
在这种语境里如果用了#一次&或#一
点儿&!是否存在语序偏误!有时难以确定!
如"
,/4-7我不喜欢坐公共汽车所以大学
生的四年里一次也没坐公共汽车(
,/+-7我第一次来北京的时候$我一
点儿也不会说汉语(
似乎换成以下说法后可接受性更强"
,/46-%%一次公共汽车也没坐(
,/+6-%%一点儿汉语也不会说(
但是!有时只能采用跟,/4-$,/+-类似
的句式!如"
,/.-所以在医院工作时一次也没有跟
患者吵架(
,/8-一点儿也没想过父母(
总之!对于这种语境!多教几种句式!
把每种句式的用法说清楚!是有利于消除
丙类语序偏误的(
)*.当语料规模充分大时!可以近似
地用频率来表示概率(按照我们为甲$乙$
丙三类语序偏误所划定的语境条件!偏误
发生率和偏误覆盖率分别为"
甲类 8*/.5 3.*/45
乙类 )2*895 3+*+.5
丙类 23*445 299*995
偏误覆盖率高!表明语境条件分析准
确’在这个前提下!可以认为偏误发生率是
客观存在的事实(不过!需要指出的是!我
们虽然分析了约299万字语料!但是对于留
学生语料的总体来说!仍然是一个很小的
样本!以上数据只是有一定的参考价值而
已(
/ 背景分析
::;<所列的语篇属性有)/种!我们从
中选择了第一语言,即母语背景=-$学时等
级,写作该语篇时所在年级阶段-和语料类
型,作文考卷$作文练习$读后写>听后写-
三种语篇属性来作背景分析(
/*2我们所检索的核心语料共有2+9/
篇!含副词#也&的语料为2293篇!就是说!
虽然总的来说副词#也&使用率偏高!但是
也只有不到 .95 的语篇使用了#也&(#也&
的语篇覆盖率主要跟学时等级有关(下面
学时等级2?8分别表示写作时在读第2学
期%第8学期!学时等级为3的只有两篇!在
+4
世界汉语教学233+年第)期,总第/+期-
本次及以下!"#和!"$的统计中均忽略不
计%
学时
等级
全部
语篇
用&也’
语篇
语篇
覆盖率
( )() ((* $#"+,
) !+# ))- *("),
! !.* )## *!"),
# )#* )/( .("+,
$ (-* ($* +-"*,
* (/! -/ .+"#,
+ $# #* .$"),
. !( )* .!"-,
这种情况大致可以解释为0在(1!学
时等级时0留学生还没有学或只是刚刚学
习副词&也’0所以语篇覆盖率较低2
!")从语料类型来看0副词&也’的使
用率和偏误率如下%
语料类型 词次 用&也’次数
偏误
次数 使用率 偏误率
作文考卷 -)(.( **- $! /"+)$+, +"-),
作文练习 !*$)/( )!!* )#* /"*!-*, (/"$!,
读3听后写 +*#-/ !*) )- /"#+!!, ."/(,
其中0作文考卷的使用率最高0偏误
率最低0大概可以解释为写作时通常较为
严肃认真4作文练习则比较自由0所以偏误
率最高4读后写3听后写虽然气氛不那么紧
张0但是学生在语言上不可能有很大的自
由发挥0所以使用率最低2总之0我们认为
作文练习最能真实地反映留学生的汉语能
力0而作文考卷可以反映他们所能达到的
最高水平2
!"!5567的核心语料中0有第一语言
$*种0其中希伯莱语背景语料#篇8#++词
次90没用一个&也’字2其他$$种母语背景
的语料0词次在一万以上的有 ((种0副词
&也’的使用率和偏误率如下%
母语
背景 词次
用&也’
次数
偏误
次数 使用率 偏误率
阿拉
伯语 (/!+. $$ (# /"$!//, )$"#$,
朝鲜语 .--(- #/( #/ /"##*/, -"-.,
德语 (#$.! .) (! /"$*)!, ($".$,
俄语 )*(($ ()* * /"#.)$, #"+*,
法语 )*-(# (** (+ /"*(*., (/")#,
汉语 ((--. (!$ $ ("()$), !"+/,
罗马尼
亚语 (//+$ #! / /"#)*., /"//,
日语 (#()#- -#! ()$ /"**+*, (!")*,
泰语 ()./! -- - /"++!!, -"/-,
西班
牙语 (#//! ((( * /"+-)+, $"#(,
英语 +)**- #*/ !- /"*!!/, ."#.,
偏误率最低的是罗马尼亚语背景的0
不过他们的使用率也相当低2使用率最高
而且偏误率又相当低的是汉语背景的0这
种情况比较好解释%这些留学生虽然生长
在海外0但是家庭的语言环境对他们仍有
很大的影响2
从朝鲜语:日语和英语三大背景的语
料来看0日语背景的使用率最高0偏误率也
最高4英语背景的偏误率较低0但使用率不
算低4朝鲜语背景的使用率最低0偏误率居
中2若区分偏误类型0其所占比例如下%
母语背景甲类偏误乙类偏误丙类偏误丁类偏误
朝鲜语 ()"$, )"$, +"$, ++"$,
日语 (!"*, (!"*, ($"), $+"*,
英语 $"(, +"+, )"*, .#"*,
可以看出0日语背景的语料中0&也’
的各类偏误分布比较均匀0乙类和丙类偏
误的比例明显高于其他母语背景语料中同
类偏误的比例4英语背景语料中主要是丁
类偏误0其他类型的偏误所占比例都较低2
!"#从学时等级来看0副词&也’的使
用率和偏误率如下%
学时
等级 词次
用&也’
次数 偏误次数 使用率 偏误率
( !+..- (-- (+ /"$)$), ."$#,
) (/$.#)$// $- /"#+)#, (("./,
! ((*..**(- +( /"$)-*, (("#+,
# (/./##+** *# /"+/-/, ."!*,
$ *+$-# #+) $) /"*-.!, (("/),
* $*)*( #+( #! /".!+), -"(!,
+ )#+$$ )(- () /"..#+, $"#.,
. ($.*# ((- (/ /"+$/(, ."#/,
如果不计第(和第.学时等级0直观地
看0随着学时等级的提高0&也’的使用率是
从低到高4偏误率则从高到低2这一点符合
语言教学的一般规律2第.学时等级的情况
+$
世界汉语教学(--*年第)期8总第!*期9
有点特殊!虽然使用率趋于正常是我们所
期望的"但是错误率明显上升则不好解释#
$%&学时等级跟副词’也(的使用率和
偏误率到底是什么关系"这实际上是’也(
的教学效果如何的问题"所以我们打算用
统计学上的方差分析方法来作比较严格的
检验#为了排除母语背景和语料类型的影
响"我们选择至少用了一次副词’也(的日
语背景的作文练习语料"除去学时等级为)
的一篇"共计 *+&篇",-&+&词 次".$&个
’也(")-个偏误#我们先统计每篇的词次/
’也(的个数/偏误个数"并计算出每篇的使
用率和偏误率0然后按学时等级将语篇分
成,组"每组篇数/平均使用率/平均偏误率
为!
1 21 341 341
5 *) 6%.,$7 $%++,7
* *+ 5%5&.7 *6%+&57
$ $+ 6%.*-7 **%6&)7
+ *, 6%)*57 5$%,+.7
& .+ 5%6-,7 5*%$&57
- ** 5%5667 ,%$.,7
. *6 6%..57 5$%5,&7
, 5+ 6%.$+7 5*%6,57
总的平均使用率和总的平均偏误率分
别为6%)$-7和5$%*&67#
现在对’也(的使用率进行单因子8学
时等级9不等重复试验的方差分析#:按以
下两个公式分别计算组间均方离差/组内
均方离差!
3;<=8>
,
1=5
218341?349
*9@8,359
3;A=8>
,
1=5
>
21
B=5
84B133419
*9@8*+&
3,9
3;A反映了数据之间的随机误差大小"
3;<除了反映随机误差大小之外"还反映了
各组8学时等级9平均使用率之间的差异#
如果比值3;<@3;A过大8大于或等于某个临
界值9"则表明组间差异比较显著"否则可
以认为组间差异不甚显著#经计算"这两个
值之比为!
C6=3;<@3;A= *%6+$$
查C分布表"C6%6&8."*$.9= *%65D
C6"故应认为学时等级对副词’也(的使用
率有显著影响#E
用同样方法对’也(的偏误率进行单因
子8学时等级9不等重复试验的方差分析"
结果为 C6=5%++&DC6%6&8."*$.9"故应
认为学时等级对副词’也(的偏误率没有显
著影响#
+ 结论
通过语境分析和背景分析"我们可以
得出以下结论!
8一9语境分析可以帮助我们比较准确
地划定偏误发生的范围"这对于汉语语法
研究和对外汉语语法教学都有启发作用#
8二9从所分析的语料来看"副词’也(
的使用率和偏误率跟母语背景和语料类型
都有较密切的关系#学时等级对’也(的使
用率有显著影响"对’也(的偏误率没有显
著影响#
附注
F 汉语中介语语料库系统8GGHI9是国家教
委和国家汉办’八五(规划项目"北京语言学院’八
五(规划重点项目"已于5))&年底通过专家鉴定"
评定为’国内外领先水平(#课题负责人是储诚志
和本文作者"参加人还有张旺熹/张伟/魏苹和朱
旗#语料总规模为$&*万字#
J 有时一句多例#含副词’也(的句子是$*+.
个#
K 从上下文看"这句话的意思是说"作为消
费者对电器质量的重视#
L ’还(限于副词#M现代汉语频率词典N中是
把介词’和(跟连词’和(一起统计的"因此我们这
,&
世界汉语教学5))-年第*期8总第$-期9
里对 !!"#的数据也作同样处理$
% 意思是选择职业$
& ’第一语言(在概念上比’母语(准确$这里
称’母语背景(是为求方便和通俗$
) 各学时等级的语篇多寡不一*为了充分利
用*宜采取这种方法$由于计算公式跟等重复试验
不同*不会影响结论的可靠性$
+ 这里 ,-./012和 34,-.3560/2分别是
第一自由度和第二自由度$
参考文献
北京语言学院语言教学研究所-17/829现代
汉语频率词典:*北京语言学院出版社*第1版$
佟慧君-17/829外国人学汉语病句分析:*北
京语言学院出版社*第1版$
鲁健骥-17762外国人学汉语的语法偏误分
析*9第四届国际汉语教学讨论会
选:*北京语
言学院出版社*第1版$
刘月华-17/42状语的分类和多项状语的顺
序*9语法研究与探索:第1辑*北京大学出版社*第
1版$
唐象能 戴俭华-177529数理统计:*机械工
业出版社*第1版$
作者简介
陈小荷*男*江西人$师从朱德熙先生学习现代汉语语法*17/7年北京大学中文系研究
生毕业*博士$毕业后一直在北京语言学院信息处理研究所工作*副教授$研究方向;计算
语言学*现代汉语语法*赣方言语法$曾负责’现代汉语语义分析词典(<’汉语中介语语料
库系统(等软件项目的实施*发表9汉语语义自动分析的任务与策略:<9主观量问题初探:<
9汉语口语里表’=再说(的句末语素’着(:等论文
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
?
??
?
$
第二届全国现代汉语词汇学术研讨会在烟台召开
1778年5月1日至5日*第二届全国现代汉语词汇学术研讨会在烟台召开$来自
全国各高等院校及研究<出版单位的8@多位学者出席了会议$会上洋溢着友好<诚
挚<平等<热烈<自由的学术气氛$提交的34篇论文体现了中国词汇学研究的前沿水
平*表明了传统词汇学正在向现代词汇学过渡$这次会议推动了中国词汇学研究*
并且展示了中国词汇学史更上一层楼的美好前景$ -ABABCB2
9国际商务汉语:电视教学片摄制完成
由北京语言学院教师编写的9国际商务汉语:电视教学片近日摄制完成$该片
以两位美国商务工作者来华进行商务活动为主线*创造真实生动的商务氛围*使用
丰富的商务词汇和句型*设计必要的外贸谈判环节*是一部优秀的集汉语和商贸知
识为一体的电视教学片$该片每集片长4@分钟*全片总长8@@分钟$适合为在中国
从事商务活动和世界各地从事对华贸易的外国人和外国留学生学习使用$该片将
于1778年,月底首先以英文版向海外正式出版发行$ -庄清供稿2
76
世界汉语教学1778年第3期-总第48期2