天津商业大学商务智能实验报告3天津商业大学学生实验报告
开课实验室:信息专业实验室403学院名称课程名称实验类型教师评语
实验报告内容一般包括以下几个内容:1、目的要求
开课时间2016-3-2电子商务1303学班
号
20134307
姓名
席鑫
实验报告
同组姓名
无张晓琴
成绩
信息工程学院商务智能
年级、专业、班实验项目名称
实验三
□
决策树挖掘
设计
□
创新
指导教师□
验证√综合
教师签名:年月日
2、仪器用具及材料(仪器名称及主要规格、用具名称)3、实验内容及原
7数据处理
理(简单但要抓住要点,写出依据原理)4、操作方法与实验步骤5、数...
天津商业大学学生实验报告
开课实验室:信息专业实验室403学院名称课程名称实验类型教师评语
实验报告内容一般包括以下几个内容:1、目的要求
开课时间2016-3-2电子商务1303学班
号
20134307
姓名
席鑫
实验报告
同组姓名
无张晓琴
成绩
信息工程学院商务智能
年级、专业、班实验项目名称
实验三
□
决策树挖掘
设计
□
创新
指导教师□
验证√综合
教师签名:年月日
2、仪器用具及材料(仪器名称及主要规格、用具名称)3、实验内容及原
7数据处理
理(简单但要抓住要点,写出依据原理)4、操作方法与实验步骤5、数据图表格(照片)6、实验过程原始记录及结果(按实验要求处理数据、结论)8、作业题9、讨论(对实验中存在的问题、进一步的想法等进行讨论)
实验三决策树挖掘
一、实验目的
1.利用数据挖掘模型对多维仓库中的数据进行决策树挖掘。
2.浏览决策树,并对决策树进行综合分析,得出挖掘信息,进行辅助决策。二、实验内容1.决策树分析
对已有数据仓库中数据的数据挖掘,选择决策树分析,通过浏览器浏览生成的决策树。2.辅助决策
通过决策树得到可利用的信息,用此信息来确定来达到辅助决策的目的。三、实验要求
掌握数据挖掘的实现过程,并进行数据的分析处理。四、实验准备
认真理解教材中的数据挖掘的概念,决策树算法,以及算法结束后得到的分析结果处理。五、实验原理、方法和手段六、实验条件
SQLServer2005
七、实验步骤
使用给定的foodmart数据库。以及实验一所做的数据源视图。
一、决策树分析
1.创建数据挖掘模型
(1)在“解决方案资源管理器”中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”项。系统将打开“数据挖掘向导”。
(2)在“选择定义方法”窗口中,确认以选中“从现有关系数据库或数据仓库”项,单击“下一步”按钮。
(3)在“创建数据挖掘结构”页的“你们要使用何种数据挖掘技术?”下,选中列表中的“Microsoft决策树”,再单击“下一步”。
(4)在“选择数据源视图”窗口中,已默认选中WXM。在数据源视图中,单击“浏览”按钮查看各表。
(5)指定表类型。
(6)指定定型数据,在“指定定型数据”页上,可预测列(会员卡)、键列(ID号)。点击建议,可以提供相关列的建议。
(7)指定列的内容和数据类型,点击检测,内容类型会变化,完成向导。
(8)在“完成向导”页的“挖掘结构名称”中,键入“xixin”。
(9)在“挖掘模型名称”中,键入“xixin”。
(10)选择“允许钻取”选项,然后单击“完成”。
2.处理数据挖掘模型
(1)在BusinessIntelligenceDevelopmentStudio的“挖掘模型”菜单上,选择“处理挖掘结构和所有模型”。
(2)看到询问是否要生成和部署项目的警告时,请单击“是”。“处理挖掘结构”对话框随即打开。
(3)单击“运行“。
模型处理完成后,在“处理进度”对话框中单击“关闭”。在“处理挖掘结构”对话框中单击“关闭”。
3.浏览数据挖掘模型。
(1)在“数据挖掘设计器”中,选择“挖掘模型查看器”选项卡。默认情况下,设计器将打开添加到结构中的第一个模型,使用放大镜按钮调整树的显示大小。
默认情况下,Microsoft树查看器仅显示树的前三个级别。如果树级别不到三个,则查看器仅显示现有级别。可以使用“显示级别”滑块或“默认扩展”列表查看更多级别。
(2)“依赖关系网络”选项卡
“依赖关系网络”选项卡显示决定挖掘模型预测能力的各个属性之间的关系。
在“依赖关系网络”选项卡中浏览模型中,调整“所有链接”滑块可确定影响最大的属性。向下滑动滑块时,将只保留对列影响最大的属性。下图为年收入依赖的数据关系。
结合决策树,可以看到挖掘图例中共有10281个事例,其中铜卡占有55.42%,金卡占11.67%普通卡占23.53%,银卡占9.35%。颜色深表示事例多,发生的概率大,颜色浅表示事例少,发生
的概率小。
查看决策树,当条件为:“YearlyIncome=‘$130K-$150K’时,挖掘图例显示事例发生的高低状况。Bronze即铜卡发生的概率最大,达70%,同时看其三级显示,发现孩子数小于等于2的,发生的概率大,(从颜色来看),如果孩子数大于等于3个,则金卡可能性大。由此可知,拥有孩子较多的客户选择金卡的概率比拥有孩子少的客户大。
根据决策树模型,可以看出年收入对会员卡的选择影响最大:低收入段($30K以下)集中在普通卡,中等收入层集中($30K~$150K)在铜卡,而高等收入层($150K以上)更多的集中在金卡和银卡。
八、思考题
写出本决策树的规则。如:
IFYearlyIncome=‘$10K-$30K’THENMemberCard=‘Normal’
IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=2’
THENMemberCard=‘Bronze’
IFYearlyIncome=‘$$130K-$150K’ANDNumChildrenAtHome=‘=0’
THENMemberCard=‘Bronze’
IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=1’
THENMemberCard=‘Bronze’
IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=3’
THENMemberCard=‘Golden’
IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=5’
THENMemberCard=‘Golden’
IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=4’
THENMemberCard=‘Golden’
IFYearlyIncome=‘=150K’ANDNumChildrenAtHome=‘0’
THENMemberCard=‘Sliver’
IFYearlyIncome=‘=150K’ANDNumChildrenAtHome=‘不等于0’
THENMemberCard=‘Golden’
IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=1’
THENMemberCard=‘Bronze’
IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=2’
THENMemberCard=‘Bronze’
IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=0’
THENMemberCard=‘Bronze’
IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=5’THENMemberCard=‘Golden’
IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=4’THENMemberCard=‘Golden’
IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=3’THENMemberCard=‘Golden’
IFYearlyIncome=‘$90K-$110K’ANDNumChildrenAtHome=‘不等于3’THENMemberCard=‘Bronze’
IFYearlyIncome=‘$90K-$110K’ANDNumChildrenAtHome=‘=3’THENMemberCard=‘Golden’
IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=1’THENMemberCard=‘Bronze’
IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=2’THENMemberCard=‘Bronze’
IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=0’THENMemberCard=‘Bronze’
IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=5’THENMemberCard=‘Golden’
IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=4’THENMemberCard=‘Golden’
IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=3’THENMemberCard=‘Golden’
IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=1’THENMemberCard=‘Bronze’
IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=2’THENMemberCard=‘Bronze’
IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=0’THENMemberCard=‘Bronze’
IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=5’THENMemberCard=‘Golden’
IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=4’THENMemberCard=‘Golden’
本文档为【天津商业大学商务智能实验报告3】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。