精品文档:三一代码汉语计算机语音输入法
1 200510077021.4 说 明
说 明 书 第1/21页
三一代码汉语计算机语音输入法 :
技术领域
本发明涉及计算机语言、语音和汉语拼音的交叉学科。
背景技术
在已开发的“一种三一代码汉语计算机输入法”,专利号96 100728-1,的基础上~为进一步对汉语输入计算机技术的升级~实现在汉语输入的同时~开发出汉语语音的输入法。 目前计算机输入的语言都是用输入字符来表达的。它只能通过视觉的阅读来理解~而不能象人的语言通过听觉来接收~是计算机语言和人类语言存在的差异。
发明内容
本发明的任务:提供一种三一代码汉语计算机语音输入法~在用字符输入表达汉语,三一代码,的同时~还可输入语音用听觉来接收~取得计算机的汉语,字符,和语音双输的创新。 三一代码,简称汉码,在输入计算机汉语的同时~要达到语音输入的条件~必须创建汉语音调库。但是我国的语言尚未拼音化~就没有条件提供开发此项信息语音技术的数据:当前是等待我国实现拼音化之后再来开发信息技术呢,还是响应号召开展“交叉学科”的研究~把汉语拼音学科作为实现信息学科的一项“阶梯工程”来研发,这属于没有条件创造条件也要上的开发路线~无疑后者是符合加速振兴中华的战略。
本发明的技术
是:
1、一种三一代码汉语计算机语音输入法,其特征在于由一个三一代码信息语音的阶梯
工程的、汉语拼音系统工程的
~取得汉语语音技术的全部材料,26个声母的排序,汉语
60音素,884音节,3536个调节,从而完成四调的语音库和同步输入法~完成汉语和语音的
同输法。
2、一种三一代码汉语计算机语音输入法,其特征在于同步输入的标音的双发音法、无
符大写标调法和汉语标符法。
3、一种三一代码汉语计算机语音输入法,其特征在于每敲两键输入两个字母~表达一
1
2 200510077021.4 说 明 书
200510077021.4 说 明 书 第2/21页
个音节~同时输入语音的一个调节~连续构成语词、语句和普通话。
一~ 系统性开发阶梯工程:汉语是一种以调为主体的四调语言~在语音输入上是要创
建四调的语调库,语调库的数据是出自完整的汉语拼音系统工程,做为信息语音的
前提,要实现语音输入必须把它作为信息语音技术“阶梯工程”而设计。要从表
达音素的符号设计、符号的排序、符号的标音、符号音素的划分;声、韵字母数额
的标定、声韵音素的计算~才能取得汉语实际音节的数据和音调的数据~构成语
调库的数据条件。
二~ 阶梯工程的设计:是以现行“汉语拼音方案”,简称“汉拼”,为基础~通过以下
的程序~把“汉语拼音学科”系统化,取得语调库的各项数据~完成信息技术的
阶梯工程~从而使我国在未实现拼音化之前通过阶梯工程的26个符号即可主宰计
算机语言~攀登信息技术的高峰。
1、符号的设定:根据1958年周总理在“当前文字改革的任务”
中指出:“汉语决定采用拉丁字母为拼音字母”应当确定这样一条原则”,本发明遵守这一原则~采用拉丁字母。 ~ 2、符号的排序: 根据我国现行汉语拼音和近百年来的拼音历史的习惯~都是以声母为主体的b p m f,- - 为序列~因为它符合汉语声母在前排列的规律。为进一步提高其科学性、在单元组合上作了对称性、压韵性的必要的调整~构成拼音系统骨架结构的排序:
b p m f g k h z c s i u y
d t n l j q x v ,zh, a,ch, w,sh, o e r 3、音素的标定:音素是由语言自然形成的基本语音元素~它划分声母和韵母两类。以“汉语拼音方案”,以下简称“汉拼”,为例:设定声母为21个~韵母34个,共55个音素,。经本案的研发~实际的声母是26个~韵母是34个共计60个音素。 “汉拼”短缺音素的标定:是把 5个中性音素的字母i、u、y、o、 e、仅列入韵母行列~并未列入声母行列。它是双重任务的符号~就必须双方列入~否则声母方缺少了5个音素~将造成总音节数~短缺170个音节,5×34, = 短缺 680个调节~不能表达全部汉语音调数~因此必须补充列入5个声母~达到原26个声母的实际。
4、符号的标音:用26个符号进行承载60个音素~叫做符号标音。“汉拼”采用一音多符制,复合韵母,的标音法。与本发明的 “汉语输入法“一符多音制的标音,采用双发音方法取代“汉
2
3 200510077021.4 说 明 书
拼”一音多符制的标音 ,相比~不仅取得语音双输入的同步性~同时也把符号的标音效率提高
一倍。
汉语三一代码技术 ( 1959 -1998 )
"汉拼"是由声、韵、调三种元素用三种码符来表达的。"三一代码"是经过优化把三种元素用一种码符来
完成。每个代码都是声码,把它放在韵码位置上代替韵码,又都是韵码。把大写代码代入字间标示四调,它还是
调码,故叫“汉语三一代码”(简称汉码)。
(一).双发音法则:每个代码在单独或声码位置发声码音.在韵码位置,发韵码音,如下:
b p m f g k h
玻-耶 坡-腰 摸-烟 佛-英 哥-昂 克-亨 喝-翁,佣
b-ie p-iao m-ian f-ing g-ang k-eng h-ong.iong
ㄅ-ㄝ ㄆ-ㄧㄠ ㄇ-ㄧㄢ ㄈ-ㄧㄥ ㄍ-ㄤ ㄎ-ㄥ ㄏ-ㄨㄥ.ㄩㄥ
z c s i u y
资-安 疵-恩 思-优 一-一 乌-乌 迂-迂,歪
z-an c-en s-iu i-i u-u y-y.uai
ㄗ-ㄢ ㄘ-ㄣ ㄙ-ㄧㄡ ㄧ-ㄧ ㄨ-ㄨ ㄩ-ㄩ.ㄨㄞ
d t n l j q x
得-因 特-威,约 讷-弯,冤 勒-温,晕 基-哀 其-诶 西-奥
d-in t-ui.ve n-uan.van l-un.vn j-ai q-ei x-ao
ㄉ-ㄧㄣ ㄊ-ㄨㄟ.ㄩㄝ ㄋ-ㄨㄢ.ㄩㄢ ㄌ-ㄨㄣ.ㄩㄣㄐ-ㄞ ㄑ-ㄟ ㄒ-ㄠ
v a w o e r
知-央,汪 吃-阿 尸-挖,呀 窝 恶 日-儿,欧
zh-iang.uang ch-a sh-ua.ia o-uo e-e •r-er.ou
ㄓ-ㄧㄤ.ㄨㄤ ㄔ-ㄚ ㄕ-ㄨㄚ.ㄧㄚ ㄛ-ㄛ ㄜ-ㄜ ㄖ-ㄦ.ㄡ
(二).大写标调法: 把大写代码,按规则写在声,韵码的位置,标示四调。单独小写读一调,单独大写读四调。
规则如下:
1调 2调 3调 4调
— , ? •,
ma (妈) mA(麻) MA(马) Ma(骂)
小小 小大 大大 大小
(三).汉语标符法:
1.韵符:”o” ,每个代码单独使用发声母音。如需发韵母亲音时,则在代码前加[O]
例如: (安全) "ozqN".
2.点符:“‘”,在音节之前标示须省目的人、地名。如(北京) “ 'BQjf。(一般不标注)。两个代码,在相拼
位置而不应相拼时,则在两码之间上部,用[']隔开,例如: (哥哥) "g'g" (此
为手写时使用)。点符在音节
之尾,标示 "轻声",如:(东西)指物件 “ dhxi’”[轻声]。
3.空符:书写语言以词组为原则,每一个词组之间加空格符以示划分。如:
举例: ( 从此 中国人 有了 自己 语言 主宰 的 电脑 ) (16字)
汉拼: cóngcǐzhònggǘorén yǒule zījǐ yǚián zhǚzǎi dē diǎnnǎo(45+16=61符)
汉码: cHCI vhGOrC IRle ZiJI YYiZ VUZJ de DmNX. 32(符 )
3
4 200510077021.4 说 明 书
200510077021.4 说 明 书 第4/21页
( 单音表 )
声码单音符:
bo po mo fo ge ke he zi ci si ii uu yy (uj)
de te ne le ji qi xi vi ai wi oo ee ri
韵码单音符:
ib ip im if og ok oh 'yh oz oc os
(ie)(ix)(iz) (hk) (uk) (ir)
id uq yt uz yn uc yl oj oq ox og ig oa ow ia oo ee er or
注: ( 7个括弧的音节码,是3-1代码输入汉字软件的专用码)
5、音节和调节的计算:~音节公式:声母×韵母=音节, 26×34 = 884 个音节,。调节公式: 音节× 4 = 调节 ,884 × 4 = 3536个,见音节表。,四调拼音课表附最后,
HzYY 3-1DjMA idJBBP ( 汉语三一代码音节表 )
(汉字一声注音)
???????????????????????????????
b p m f g k h h' z c s i u y y' d t t' n n' l l' j q x v v' a w w' o •e r r' ( 34)
ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag uag a • ua ia o e er ou (75)
椰 要 烟 英 昂 亨 翁 拥 安 恩 优 衣 乌 迂 歪 音 威 约 弯 冤 温 晕 埃 诶 奥 央 汪 阿 挖 压 窝 额 儿 欧 汉字
?????????????????????????????????????????????????????? 音节数 b 玻> bb bp bm bf bg bk bz bc bi bu bd bj bq bx ba bo
pb pp pm pf pg pk pz pc pi pu pd pj pq px pa po pr mb mp mm mf mg mk mz mc ms mi mu md mj mq mx ma mo me mr fg fk fz fc fu fq fa fo fr gg gk gh gz gc gu gy gt gn gl gj gq gx gv ga gw go ge gr kg kk kh kz kc ku ky kt kn kl kj kx kv ka kw ko ke kr hg hk hh hz hc hu hy ht hn hl hj hq hx hv ha hw ho he hr zg zk zh zz zc zi zu zt zn zl zj zq zx za zo ze zr cg ck ch cz cc ci cu ct cn cl cj cx ca co ce cr sg sk sh sz sc si su st sn sl sj sx sa so se sr if ig ih iz ii id in il ix ia io ie ir ug uk uz uc uu uj uq ua uo yz yy yt yn yl db dp dm df dg dk dh dz ds di du dt dn dl dj dx da dw do de dr tb tp tm tf tg tk th tz ti tu tt tn tl tj tx ta to te tr nb np nm nf ng nk nh nz nc ns ni nu ny nd nt nn nj nq nx nv na no ne nr lb lp lm lf lg lk lh lz ls li lu ly ld lt ln ll lj lq lx lv la lw lo le lr jb jp jm jf jh js ji jy jd jt jn jl jv jw qb qp qm qf qh qs qi qy qd qt qn ql qx qv qw xb xp xm xf xh xs xi xy xd xt xn xl xv xw vg vk vh vz vc vi vu vy vt vn vl vj vx vv va vw vo ve vr ag ak ah az ac ai au ay at an al aj ax av aa ao ae ar wg wk wz wc wi wu wy wt wn wl wj wx wv wa ww wo we wr og oz oc oj ox oa oo oe eg ez ec eu ej eq ex ea eo ee er rg rk rh rz rc ri ru rt rn rl rx ro re rr