数据分析与数据挖掘--实验六 聚类分析实验(2)
实验报告封面
课程名称: 数据分析与数据挖掘 课程代码:
任课老师: 周化 实验指导老师: 周化
实验报告名称:聚类分析(2)——K均值与K—最近邻方法
学生姓名:
学号:
教学班:
递交日期:
签收人: ...
实验
封面
课程名称: 数据
与数据挖掘 课程代码:
任课老师: 周化 实验指导老师: 周化
实验报告名称:聚类分析(2)——K均值与K—最近邻方法
学生姓名:
学号:
教学班:
递交日期:
签收人:
我申明,本报告内的实验已按要求完成,报告完全是由我个人完成,并没有抄袭行为。我已经保留了这份实验报告的副本。
申明人(签名):
实验报告评语与评分:
评阅老师签名:
一、实验名称:聚类分析(K均值、K中心点)
二、实验日期:2017年10月12日
三、实验目的:
(1)熟悉和巩固数据分析中的聚类划分的方法;
(2)能够通过距离相似度计算理解聚类分析中的K-均值算法和K-最近邻算法;
(3)能够通过聚类工具,对数据样本完成聚类后讨论类别划分的特征
四、实验用的仪器和材料:
硬件:PC电脑一台;
配置:内存,2G及以上 硬盘250G及以上
软件环境:操作系统 windows server 2003
数据库环境:Microsoft SQL SERVER 2005
五、实验内容:
1)熟练掌握课件
中的K均值和K最近邻实例的推演过程。
2)完成课本P217 第14题。
3)完成课本P217第20题。
(4)假设空间中的五个点{A、B、C、D、E},如下图所示。各点之间的距离关系如下表所示,根据所给的数据对其运行k-medoids算法实现划分聚类(设k=2)。
样本点
A
B
C
D
E
A
0
1
2
2
3
B
1
0
2
4
3
C
2
2
0
1
5
D
2
4
1
0
3
E
3
3
5
3
0
初始近邻点定为 A、B
(5)采用数据挖掘工具平台的聚类分析功能,完成一个任意样本的聚类,并根据所学评价该聚类的特征和优劣。(参考
本P215)聚类验证
本文档为【数据分析与数据挖掘--实验六 聚类分析实验(2)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。