为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

天津商业大学商务智能实验报告3

2017-06-03 18页 doc 791KB 27阅读

用户头像

is_601191

暂无简介

举报
天津商业大学商务智能实验报告3天津商业大学学生实验报告 开课实验室:信息专业实验室403学院名称课程名称实验类型教师评语 实验报告内容一般包括以下几个内容:1、目的要求 开课时间2016-3-2电子商务1303学班 号 20134307 姓名 席鑫 实验报告 同组姓名 无张晓琴 成绩 信息工程学院商务智能 年级、专业、班实验项目名称 实验三 □ 决策树挖掘 设计 □ 创新 指导教师□ 验证√综合 教师签名:年月日 2、仪器用具及材料(仪器名称及主要规格、用具名称)3、实验内容及原 7数据处理 理(简单但要抓住要点,写出依据原理)4、操作方法与实验步骤5、数...
天津商业大学商务智能实验报告3
天津商业大学学生实验报告 开课实验室:信息专业实验室403学院名称课程名称实验类型教师评语 实验报告内容一般包括以下几个内容:1、目的要求 开课时间2016-3-2电子商务1303学班 号 20134307 姓名 席鑫 实验报告 同组姓名 无张晓琴 成绩 信息工程学院商务智能 年级、专业、班实验项目名称 实验三 □ 决策树挖掘 设计 □ 创新 指导教师□ 验证√综合 教师签名:年月日 2、仪器用具及材料(仪器名称及主要规格、用具名称)3、实验内容及原 7数据处理 理(简单但要抓住要点,写出依据原理)4、操作方法与实验步骤5、数据图表格(照片)6、实验过程原始记录及结果(按实验要求处理数据、结论)8、作业题9、讨论(对实验中存在的问题、进一步的想法等进行讨论) 实验三决策树挖掘 一、实验目的 1.利用数据挖掘模型对多维仓库中的数据进行决策树挖掘。 2.浏览决策树,并对决策树进行综合分析,得出挖掘信息,进行辅助决策。二、实验内容1.决策树分析 对已有数据仓库中数据的数据挖掘,选择决策树分析,通过浏览器浏览生成的决策树。2.辅助决策 通过决策树得到可利用的信息,用此信息来确定来达到辅助决策的目的。三、实验要求 掌握数据挖掘的实现过程,并进行数据的分析处理。四、实验准备 认真理解教材中的数据挖掘的概念,决策树算法,以及算法结束后得到的分析结果处理。五、实验原理、方法和手段六、实验条件 SQLServer2005 七、实验步骤 使用给定的foodmart数据库。以及实验一所做的数据源视图。 一、决策树分析 1.创建数据挖掘模型 (1)在“解决方案资源管理器”中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”项。系统将打开“数据挖掘向导”。 (2)在“选择定义方法”窗口中,确认以选中“从现有关系数据库或数据仓库”项,单击“下一步”按钮。 (3)在“创建数据挖掘结构”页的“你们要使用何种数据挖掘技术?”下,选中列表中的“Microsoft决策树”,再单击“下一步”。 (4)在“选择数据源视图”窗口中,已默认选中WXM。在数据源视图中,单击“浏览”按钮查看各表。 (5)指定表类型。 (6)指定定型数据,在“指定定型数据”页上,可预测列(会员卡)、键列(ID号)。点击建议,可以提供相关列的建议。 (7)指定列的内容和数据类型,点击检测,内容类型会变化,完成向导。 (8)在“完成向导”页的“挖掘结构名称”中,键入“xixin”。 (9)在“挖掘模型名称”中,键入“xixin”。 (10)选择“允许钻取”选项,然后单击“完成”。 2.处理数据挖掘模型 (1)在BusinessIntelligenceDevelopmentStudio的“挖掘模型”菜单上,选择“处理挖掘结构和所有模型”。 (2)看到询问是否要生成和部署项目的警告时,请单击“是”。“处理挖掘结构”对话框随即打开。 (3)单击“运行“。 模型处理完成后,在“处理进度”对话框中单击“关闭”。在“处理挖掘结构”对话框中单击“关闭”。 3.浏览数据挖掘模型。 (1)在“数据挖掘设计器”中,选择“挖掘模型查看器”选项卡。默认情况下,设计器将打开添加到结构中的第一个模型,使用放大镜按钮调整树的显示大小。 默认情况下,Microsoft树查看器仅显示树的前三个级别。如果树级别不到三个,则查看器仅显示现有级别。可以使用“显示级别”滑块或“默认扩展”列表查看更多级别。 (2)“依赖关系网络”选项卡 “依赖关系网络”选项卡显示决定挖掘模型预测能力的各个属性之间的关系。 在“依赖关系网络”选项卡中浏览模型中,调整“所有链接”滑块可确定影响最大的属性。向下滑动滑块时,将只保留对列影响最大的属性。下图为年收入依赖的数据关系。 结合决策树,可以看到挖掘图例中共有10281个事例,其中铜卡占有55.42%,金卡占11.67%普通卡占23.53%,银卡占9.35%。颜色深表示事例多,发生的概率大,颜色浅表示事例少,发生 的概率小。 查看决策树,当条件为:“YearlyIncome=‘$130K-$150K’时,挖掘图例显示事例发生的高低状况。Bronze即铜卡发生的概率最大,达70%,同时看其三级显示,发现孩子数小于等于2的,发生的概率大,(从颜色来看),如果孩子数大于等于3个,则金卡可能性大。由此可知,拥有孩子较多的客户选择金卡的概率比拥有孩子少的客户大。 根据决策树模型,可以看出年收入对会员卡的选择影响最大:低收入段($30K以下)集中在普通卡,中等收入层集中($30K~$150K)在铜卡,而高等收入层($150K以上)更多的集中在金卡和银卡。 八、思考题 写出本决策树的规则。如: IFYearlyIncome=‘$10K-$30K’THENMemberCard=‘Normal’ IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=2’ THENMemberCard=‘Bronze’ IFYearlyIncome=‘$$130K-$150K’ANDNumChildrenAtHome=‘=0’ THENMemberCard=‘Bronze’ IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=1’ THENMemberCard=‘Bronze’ IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=3’ THENMemberCard=‘Golden’ IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=5’ THENMemberCard=‘Golden’ IFYearlyIncome=‘$130K-$150K’ANDNumChildrenAtHome=‘=4’ THENMemberCard=‘Golden’ IFYearlyIncome=‘=150K’ANDNumChildrenAtHome=‘0’ THENMemberCard=‘Sliver’ IFYearlyIncome=‘=150K’ANDNumChildrenAtHome=‘不等于0’ THENMemberCard=‘Golden’ IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=1’ THENMemberCard=‘Bronze’ IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=2’ THENMemberCard=‘Bronze’ IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=0’ THENMemberCard=‘Bronze’ IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=5’THENMemberCard=‘Golden’ IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=4’THENMemberCard=‘Golden’ IFYearlyIncome=‘$110K-$130K’ANDNumChildrenAtHome=‘=3’THENMemberCard=‘Golden’ IFYearlyIncome=‘$90K-$110K’ANDNumChildrenAtHome=‘不等于3’THENMemberCard=‘Bronze’ IFYearlyIncome=‘$90K-$110K’ANDNumChildrenAtHome=‘=3’THENMemberCard=‘Golden’ IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=1’THENMemberCard=‘Bronze’ IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=2’THENMemberCard=‘Bronze’ IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=0’THENMemberCard=‘Bronze’ IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=5’THENMemberCard=‘Golden’ IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=4’THENMemberCard=‘Golden’ IFYearlyIncome=‘$70K-$90K’ANDNumChildrenAtHome=‘=3’THENMemberCard=‘Golden’ IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=1’THENMemberCard=‘Bronze’ IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=2’THENMemberCard=‘Bronze’ IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=0’THENMemberCard=‘Bronze’ IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=5’THENMemberCard=‘Golden’ IFYearlyIncome=‘$30K-$50K’ANDNumChildrenAtHome=‘=4’THENMemberCard=‘Golden’
/
本文档为【天津商业大学商务智能实验报告3】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索