数据冗余危害
案例——数据冗余的危害及消除 一、情景导入
学校要聘请名誉校长,如果比尔盖茨、奥巴马、李娜、周杰伦、苏珊大妈五
人跑来竞选,请班里十位同学来投票。
选票样式如下:
名誉校长候选人选票 候选人名单:
苏珊大妈 奥巴马 李娜 周杰伦比尔盖茨
请在认为合适的人选姓名下方相应栏内打“?” 投票人情况:
姓名:
所在班级:
性别:
将学生提交的选票进行统计,得到下
: 投票人姓名 性别 所在班级 候选人
高二10班 李娜 丁宇庭 男
高二10班 周杰伦 孙中川 男
高二10班 比尔盖茨 倪慧明 女
高二10班 李娜 高原 男
高二10班 苏珊大妈白钰 女
高二10班 比尔盖茨 吴丽雅 女
高二10班 奥巴马 杜鹏俊 男
周杰伦 高二10班袁航 男
高二10班 周杰伦 栾志超 男
高二10班 奥巴马蒋蓉 女
教师抛出问
:请同学们认真观察这张表存在哪些问题?有没有哪些东西是多余的,有没有少了什么?
学生讨论思考
:
1、班级、性别、候选人信息存在重复。
2、表中无序号,如果投票人数很多,会增加管理难度。
二、引入新知识
1、引出数据冗余概念:
这张表中很多数据都重复了,输入起来既费力又费时。数据库中相同的数据重复存储就称为数据冗余。
【数据冗余危害一】:
现在是十张选票的统计结果,如果全校两千名学生投票,组织数据时除了很麻烦,还会很浪费存储空间。数据量越大,占据的存储空间越大。 如果:
参选的奥巴马同学强烈要求把统计表中自己的姓名更改为英文全称:
Barack Hussein Obama Jr.
(?_?)难不成要one by one去改?
同时,表格没有编号,就像学生没有学号,考试没有考号,个人没有身份证
号一样,没有能对选票进行唯一识别的标志。当数据量很大时,会造成管理的混
乱。
2、任务驱劢:如何解决上述问题?
提示:利用排序及合并单元格功能,修改统计表。
选票编号 投票人姓名 性别 所在班级 候选人 1 杜鹏俊 男
奥巴马 2 蒋蓉 女
3 倪慧明 女
比尔盖茨 4 吴丽雅 女
5 丁宇庭 男
高二10班 李娜 6 高原 男
苏珊大妈 7 白钰 女
8 孙中川 男
周杰伦 9 袁航 男
10 栾志超 男
3、【数据冗余危害一】:
如果发现第一张选票为废票,删除掉第一条记录,会发现其他的相关数据也会被删除,例如班级信息,造成数据的丢失,也称为删除异常。
4、引导学生思考终极解决办法,得出结论:进行表格拆分。
拆解成“投票人情况表”、“候选人情况表”,进一步可以继续细分为:投票人情况表、班级代码表、性别代码表、候选人代码表等,并引导学生选择合适的主键、建立起表不表对应的联系。