为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

基于中文字体的Word文档数字水印算法

2017-09-15 11页 doc 58KB 22阅读

用户头像

is_037433

暂无简介

举报
基于中文字体的Word文档数字水印算法基于中文字体的Word文档数字水印算法 文章编号,1672-2892(2007)02-0090-05 基于中文字体的Word文档数字水印算法 吕 伟, 方勇, 张野, 邓远林, 石稀林 (四川大学 电子信息学院,四川 成都 610064) 摘 要,针对常见的中文 Word 文档,分析了数字水印(DigitaWl aterm arking)技术的特点和现有 文本数字水印的嵌入方式, 提出了一种基于中文字体的水印嵌入方式 在。此基础上设计了一套详 细完整的文本数字水印算法实施方案, 该方案具有良好的隐蔽性、安全性以及...
基于中文字体的Word文档数字水印算法
基于中文字体的Word文档数字水印算法 文章编号,1672-2892(2007)02-0090-05 基于中文字体的Word文档数字水印算法 吕 伟, 方勇, 张野, 邓远林, 石稀林 (四川大学 电子信息学院,四川 成都 610064) 摘 要,针对常见的中文 Word 文档,了数字水印(DigitaWl aterm arking)技术的特点和现有 文本数字水印的嵌入方式, 提出了一种基于中文字体的水印嵌入方式 在。此基础上设计了一套详 细完整的文本数字水印算法实施方案, 该方案具有良好的隐蔽性、安全性以及一定的鲁棒性。 关键词,数字水印, 中文字体, 鲁棒性,嵌入 中图分类号,TP309.7, TP391.1文献标识码,A Digital Watermarking Algorithm Based on Chinese Font in the Word Document LV Wei,FANG Yong,ZHANG Ye,DENG Yuan-lin,SHI Xi-lin (Collegeo f Electronic Informatio,nSichuan Universit,yChengdu Sichuan 61006,China)4 Abstract, This paper analysethse featureo f digital watermarkintgechn ology and the existente mbedding methods o f text digital watermarkingA. i ming at Chinese Wor d document, th e embedding methoof d watermarking based on Chinfoesnt ei s introduced, anthde project odf igital watermarking algorithm baseon d that methoids designed. This projecis saft e androbust. Key words, digital watermarking, Chinesefont , robustness embedding, 1 引言 随 着 网 络规模 的 不 断扩大 ,网 上各种 数 字 化产品 (如 图像、视频、音 频 、文档等 )的数 量也急剧 增 加 。 开放性不 断 扩展的情 况 下 ,对 数字化 产品版权 的 保护显得 日 益迫切 。数 字 水印技术 是 信息隐藏 技 术领域的 支 ,是一种 有 效的数字 产 品版权保 护 和数据安 全 维护技术 。该 技术在数 字 化中 嵌 入不可察 觉 的信息 ,即 并通过计 算 操作将其 提 取出来 ,从 而 起到保护 数 字作品版 权 或完整性 的 作用 。但目前 数字水印 的 研究主要 图像与视频,针对文档的数字水印隐藏方式和算法的研究却较少。对于文本数字水印,文 [1]献提出了利 拼音将文档进行分层,在各层中通过字符水平缩放嵌入水印的算法,文 [2献]提出 了一种基于不完整语义 水印算法,文献 [3]提出了利用内容和格式的统计信息来嵌入水印的算法 。 本文 分析了数字 水印技术的 特点和现有 文本数字水 印的嵌入方 式,针对现 实中的中文 Word文档, 提 种新的水印嵌入方式,并基于此方式设计了一套完整的文本数字水印算法实施方案,具有一定的实用性 。 2 数字水印技术 2.1 数字水印的特点 数字水印 技 术通过一 定 的算法将 一 些标志性 信 息直接嵌 入 到多媒体 内 容 (如图像 、 文本、 音频 和视频 数 当中,水 印 的存在以 不 破坏原始 作 品的欣赏 价 值和使用 价 值为 , 一般来讲 , 数字水印 应 具有以下 基 本 a) 隐蔽性,指水印与原始数据紧密结合并隐藏其中,不影响原始数据的正常使用 , b) 鲁棒性 ,数字作品 中 的水印信 息 能够抵抗 应 用过程中 的 各种恶意 或 非恶意的 操 作 ,包 括一般 的信号 几何变换, 收稿日期,2006-09-19;修回日期,2006-12-29 d) 确定性,数字水印所携带的版权信息能够被唯一确定地鉴别 , e) 易提取性,水印的嵌入和提取算法应简单 。 2.2 文本数字水印 目前多数 数 字水印的 研 究和文献 都 与静止图 像 、视频的保 护 有关 ,对 于 文 本水印的 研 究则较少 ,主 要原因是 数字文本 没 有像图像 那 样多的冗 余 信息 ,能 嵌 入 水印信息 的 空间有限 。很 多用于图 像 水印的有 效 方法 ,并 不 适 用 于文本文 档 的规则结 构 。现在对文 本 水印的研 究 主要基于 Brassil和 Maxemchuk等人提 出 的在格式 文 本中嵌入 水 印 [4 ] 的三种方案,行移编码、字移编码和特征编 码。 a) 行移编 码 ,通过 将文 本的某 一整 行垂直 移动 来嵌入 水印 。该过 程检 测水印 时不 需要原 始文 本参与 ,能 够 实现盲检测。但因为一行只能嵌入一个水印,导致文本所能携带的信息量很少。 b) 字移 编码, 通过 将文本 中的 某些单 词进 行水平 移动 来嵌入 水印 。该方 式能 嵌入的 水印 信息较 多, 但由于 在最初文档中的单词间距是不均匀的,所以在检测过程中需要原始文本的参与,不能实现盲检测 。 c) 特征编 码 ,通过 改变 某个单 个字 母的某 一特 殊特征 来嵌 入水印 。它 通过以 文中 未改变 的字 母作为 参照 , 实现了盲 检 测 。同 时 特 征 编码能嵌 入 较多的水 印 信息 ,因 此 目 前对于文 本 水印嵌入 的 研究主要 基 于该方案 ,比 如 字母替换 或 改变字母 的 高度 、大 小 等 。但许多 嵌入 方式存在 隐 蔽性问题 ,在 改变某些 字 体大小时 ,如 果有一个 与 它相同的但未做变化的字母与它相邻,读者较易认出字母的变化 。 由于中文 的 复杂性, 目 前关于中 文 文本水印 的 论文较少 , 并且主要 集 中在如何 提 高水印嵌 入 算法的性 能上 , 很少涉及完 整的文本数 字水印算法 实施方案。 本文根据数 字水印技术 的特点和文 本数字水印 的特征编码 嵌入方 式,针对常 见的中文 Word文档,设计 了一套基于 中文字体的 文本数字水 印算法,并 提出一个相 对完整的文 本 数 字水印算法实施方案。 3 基于中文字体的数字水印算法设计方案 3.1 算法思想 宋体字作为我国正式公文书写所要求的字体,一直以来也是人们书写中文文档的惯用字体 Mic。rosoft Word除了常 用的宋体字 外,还提供 了其他许多 中文字体供 用户使用, 其中包括新 宋体。实验 表明,对任 意 一 个 相同文字 (任意大小、颜色,或进行加粗、倾斜处 理),宋体与新宋体的差别是人眼无法观察到的,如 1图所示。 利用该特 性,可规定文 字 字体为宋 体 时表示为 编 码“ 0”,文 字字体为 新 宋体时表 示 为编码 1,并根 据生成 的 水印信息编码调节 Word文档中部分中文的字体 (由宋体改为新宋体或相反 ),从而“” 实现水印信息的嵌入。 数数 字字 水水 印印 数数 字字 水水 印印 数数 字字 水水 印印 数数 字字 水水 印印 Fig.1 Comparison between two kinds of font 图 1 两种字体比较 3.2 水印生成算法 a) 确定欲隐藏的文本信息 D D通常 由数字、 符号、 英文 字母和 汉字 (版本或 序列 号、所 有者 或公司 名称 )构成, 根据 原始文 档和 实际需要 设计制定 欲 隐藏的文 本 信息 。由于数 字水印算 法 所能嵌入 的 二进制序 列 长度不能 超 过被嵌的 原 始文档长 度 ,同 时 过长的水 印 信息会影 响 对提取后 的 水印信息 纠 错的性能 ,因 此在格式 文 本中欲嵌 入 的文本信 息 D不宜过长 ,在 此 将 D的长度选定为 256bit,即 32个字节,该长度足以嵌入欲隐藏的文本信息 。 b) RSA加密 加密的目 的 在于即使 水 印信息被 他 人从文档 中 提取出 ,但没 有私钥 ,提取 者也不能 明 白水印的 含 义 。在文本 信息 D制定 完 毕后使用 RSA算法 ,用 256bit的公 钥对 D进行加密 ,生 成密文 D?,由 于 RSA加密算 法会把相 同 或不足 密钥长度的 明文数据加 密成与密钥 长度相同的 密文,因此 D? 数据的长 度 为 256bit ,将 D? 转化成二 进制序列 J , {j}(i=1,2,? ,256)。 i c) 添加奇偶校验码 二进制序 列 V= vvv,? ,v,当 i mod 7 =0时 (每 7个数 据位 )添加一 位校验位 c,生成新序 列 V?= vv? vcv? 1 2 ink1 2 7 1 8 vcv,? ,vc。因 此对密 文序列 J添加奇 偶 校 验码时 ,需 先将 J扩展成 259bit(7的整数 倍 ),扩展位置 填 充 0 14 2 15n k 进行添加 形 成新二进 制 序 列 J?= jj? jcj? jcj,? ,jcj? jc(j= j= j=0)。 新 二 进制 1 27 1 8 14 2 15252 36 253259 3725 7 258 259 的长度为 296bit。 c=1j?j中含奇数个 1j k7*k+1 7*k+2 7*k+7 jj?j中含偶数个 1 c=0 7*k+1 7*k+2 7*k+7 k d) 生成水印信息 W 计算原始 文 档中汉字 个 数 T,再 计 算 出整数 m=T/296,对新序 列 J?中每位进行次数为 m的 重复编码,形 的水印信息 W= j? jj? j? j? jc? cj? j,? ,j? jc? c。水印信息 W的长度为 m*296bit。 1 1 2 2 7 7 1 1 8 8 259 259 37 37 m个 m个m个 m个 m个m个m个 3.3 水印嵌入算法 提取水印 信 息 j? jj? j? j? jc? cj? j,? ,j? jc? c,并 从原 始文 档 起 始处开 始 顺 序扫描 1 1 227 7 1 1 8 8259259 37 37个汉字进行如下规则处理, 1 汉字字体设置为新宋体 W= i 0 汉字字体设置为宋体 通过检测 W中每一位的值,变换字体,把原始文档转换成水印文本,水印嵌入过程如 2所示图。 word document word document with watermark embed watermark information flag RSA encrypt watermark Fig.2 Embedding watermark 图 2 水印嵌入 水印嵌入的算法实现如下 (Algorithm, EmbedWatermarking), Input, OriginalDocument T, Watermark W Output, WatermarkDocument T? Begin for i = 1 to m*296 do if ( w= 0 ) then i T_font.SetName( )= _T("宋体 ") //修改文字字体 end if if ( w= 1 ) then i T_font.SetName() = _T("新宋体 ") end if T_font.MoveNex t//移到下个文字 end for Return T? End 3.4 水印检测算法 水印的 提取 实际上 是水 印嵌入 的逆 向过程 ,先 计算水 印文 档中汉 字个 数 T,再 计算出 整 数 m=T/296, 始化一个 长 度 为 m*296bit的二进制 序 列 B。从水印 文档起始 处 开始顺序 扫 描 ,检 测每个 汉字并对 序 列 B进 行 则处理, 1 数据块中包含大于 m/2 个 1 b= i 0 数据块中包含大于 m/2 个 0 通过扫描 每 个汉字的 字 体,按规 则 得到二进 制 序 列 {b} (i=1,2,? ,n),将 B划分成长 度 为 m的 296个 数据 i 从每块中按如下规则提取一位的 a值, i 1 汉字字体为新宋体时,i=i+1 a= i 0 汉字字体为宋体时,i=i+1 从序列 B中提 取出 296bit的 A {a}后,对 A按照 每 8位 再进行分 块,进行奇偶 校 验 ,对 奇偶校 验有误的 分 i 行比对分 析 ,最终提 取 出二进制 序 列 J= jjj? j,将 J转化 成密文 D?,再使用 RSA算 法,用私 钥 对密文 D? 1 2 i 25 6 word document with watermark check watermark watermark information flag RSA decrypt Fig.3 Checking watermark 图 3 水印提取 水印检测的算法实现如下, Algorithm, CheckWatermarking,, Input, WatermarkDocument T? Output, Watermark W Begin for i = 1 to m*296 do if (T?_font.GetName() = _T("宋体 ") ) then b= 0 i end if if (T?_font.GetName() = _T("新宋体 ") ) then b= 1 i end if T?_font.MoveNex t//移到下个文字 if ( i % m = 0 ) then a= ( b+ b+? + b) / ( m/2 + 1 )//提取出 a i / m i- m+ 1 i- m+ 2 i i end if end for J = ParityCheck ( A ) //奇偶校验检查 W = RSA ( J , PrivateKey ) Return W End 3.5 性能分析 本文采用多 个文档对该 数字水印算 法进行测试 ,在隐蔽性 方面,如图 4所示,肉眼 无法识别原 始文档,左 , 与嵌入水印后的文档,右,的区别,因此该水印算法具有良好的隐蔽性 。 Fig.4 Comparison between documents before embedded and after embedded 图 4 水印嵌入前后的文档比对 由于在 算法 设计中 采用 了 RSA加密 处 理,因 此该 水印算 法的 安全性 能基 于 RSA密码 体 制,而 破译 256bit长度 的密钥需 要 几天时间 ,从 而使未经 授 权者不能 轻 易地伪造 水 印或检测 出 水印中的 文 本信息 ,并 且 数字水印 所 携 带 的信息能 够 被唯一确 定 地鉴别 ,所以该 水 印 算法具 有 良好的安全性和确定性。 100% 设计方案 中 水印的嵌 入 和提取算 法 简单 ,具有易 80% 提取性,检测时无需原始文档,实现了盲检测 。60% 常见的格 式 调 整, 改变字 体大小 、字 间 距和行间 40% robustness 距 ,无法 影响 由该水印 算 法嵌入的 水 印 ,同 时 在 算 法 20% 设计中加 入 的奇偶校 验 编码和重 复 编码算法 ,在水 印 0% 检测过程中能够发现并纠正误码。图 5是在一千左右 0 30 60 90 120 150 180 210 240 270 300 字数 文档中的一 定数量随机 位置上进行 字体修改 而 number of changed characters Fig.5 Graph of robustness 造成正确检测水印概率的变化曲线图。如图 5所示, 图 5 鲁棒性曲线图 该算法具 有 一定的鲁 棒 性 ,但 是 攻 击 者修改文 档 字体格式 的 数量越多 ,隐 藏的文本 信 息恢复的 可 能性越小 击者将文 档 内容复制 到 记事本或 其 他文本编 辑 器后再拷 贝 回来 ,文档所 嵌入的水 印 信息将全 部 消失 ,这也 法的最大问题。 4 本文分析 了 数字水印 技 术的特点 和 现有文本 数 字水印的 嵌 入方式 ,针 对 现实中的 中 文 Word 文 档 ,提 种基于中 文 字体的水 印 嵌入方法 ,通 过设置 Word 文档中汉 字 字体方式 嵌 入水印 ,并 在 此基础上 设 计了一 完整的文 本 数字水印 算 法实施方 案 。该算法方 案 具有良好 的 隐蔽性 、安全 性以及一 定 的鲁棒性 ,具 有一定 价值。 参考文献, [ 1 ]鲁 芳 ,孙星明.基于汉语拼音的鲁棒性文本水印算法[J] .计算机工程与设计2006,27(8):1330,-1332. 赵敏之,孙星明,向华政.基于不完整语义理解的文本数字水印算法研[J]究.计算机应用研究 2006,23(6):118,-1[ 2 ] 胡晶晶,孙星明.基于单词间字符统计特征的文本数字水[J]印. 计算机工程2005,31(23):116,-118.[ 3 ] Brassil J,Low S,MaxemchuN F,ek t al. Electronic marking and identification techniqueto discourags e documenot c[ 4 ] [J]. IEEE Journal on Sel Areain sCommun 1995,13(8):1495, -1504. [ 5 ] 廖继旺,孙洪淋.用于 Word文档认证的脆弱型数字水印算 法 [J].科学技术与工程2006,6(8):1082,-1084.作者简介, 吕 伟(1977-),男 ,四 川省 乐山 市人,工 1966-) ,男 ,四川省 西昌市 人 方 勇( 教 授,主 要研究 方向为 计算机 网络与 信息 程 师 , 2000 年 毕 业 于 解 放 军 理 工 大 学 通 信 工 程 学 院 ,获 学士学 位 ,现 为在读 硕士研 究生 ,主要 主 编过国 家信息 系统安 全核心 教 程《信息系 研 究 方 向 为 网 络 与 信 息 系 统 安 全 , Email: 全 》, qinqin_he@163.com, 邓远林(1982-) , 男,湖 南省 常德 市人 张 野(1981-),男,成都 市人,在读硕 士 读 硕士研 究生 ,主要 研究方向 为网络 结构与 研 究生, 主要研 究方向 为网络 结构与 信息安 全 , 安全 , 石稀林(1982-) ,男,湖 北 省黄冈人 ,在 读 硕 士研究 生 ,主 要研究 方向为 网络结 构与信 息安 全 ,
/
本文档为【基于中文字体的Word文档数字水印算法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索