为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

数据仓库与数据挖掘技术课后作业

2012-12-25 2页 doc 1MB 54阅读

用户头像

is_802143

暂无简介

举报
数据仓库与数据挖掘技术课后作业 第一章 数据仓库与数据挖掘概述 1.数据库与数据仓库的本质差别是什么? 答:数据库用于事务处理,数据仓库用于决策分析;数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据;数据仓库的数据是大量数据库的集成;对数据库的操作比较明确,操作数据量少,对数据仓库操作不明确,操作数据量大。 数据库是细节的、在存取时准确的、可更新的、一次操作数据量小、面向应用且支持管理;数据仓库是综合或提炼的、代表过去的数据、不更新、一次操作数据量大、面向分析且支持决策。 6.说明OLTP与OLAP的主要区别。 答:OLTP针对...
数据仓库与数据挖掘技术课后作业
第一章 数据仓库与数据挖掘概述 1.数据库与数据仓库的本质差别是什么? 答:数据库用于事务处理,数据仓库用于决策分析;数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据;数据仓库的数据是大量数据库的集成;对数据库的操作比较明确,操作数据量少,对数据仓库操作不明确,操作数据量大。 数据库是细节的、在存取时准确的、可更新的、一次操作数据量小、面向应用且支持管理;数据仓库是综合或提炼的、代过去的数据、不更新、一次操作数据量大、面向分析且支持决策。 6.说明OLTP与OLAP的主要区别。 答:OLTP针对的是细节性数据、当前数据、经常更新、一次性处理的数据量小、对响应时间要求高且面向应用,事务驱动; OLAP针对的是综合性数据、历史数据、不更新,但周期性刷新、一次处理的数据量大、响应时间合理且面向分析,分析驱动。 8.元数据的定义是什么? 答:元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。 9.元数据与数据字典的关系什么? 答:在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。 18.说明统计学与数据挖掘的不同。 答:统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。 19.说明数据仓库与数据挖掘的区别与联系。 答:数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信;数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。数据仓库和数据挖掘的结合对支持决策会起更大的作用。 23.数据仓库与联机分析处理、数据挖据在决策知识方面有什么不同? 答:数据仓库中有大量的综合数据,为决策者提供了综合信息。数据仓库保存有大量历史数据,通过预测模型计算可以得到预测信息。 联机分析处理(OLAP)对数据仓库中的数据进行多维数据分析,即多维数据的切片、切块、旋转、钻取等,得到更深层中的信息和知识。 数据挖掘(DM)技术能获取关联知识、时序知识、聚类知识、分类知识等。 数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等结合,形成决策支持系统。 25.画出基于数据仓库的决策支持系统的结构图。 答:(第二页) 第二章 数据仓库原理 1、画出数据仓库结构图,说明各部分内容。 答: 高度综合数据层:这一层的数据是在轻度综合数据基础上的再一次综合,是一种准决策数据。 轻度综合数据:是从近期基本数据中提取出的,这层数据是按时间段选取,或者按 数据属性(attributes)和内容(contents)进行综合。 当前基本数据:是最近时期的业务数据,是数据仓库用户最感兴趣的部分,数据量大。 历史基本数据:近期基本数据随时间的推移,由数据仓库的时间控制机制转为历史基本数据。 2、说明数据仓库结构图中包含轻度综合数据层与高度综合数据层的作用。这些数据是根据需要临时计算的吗? 高度综合数据层:这一层的数据是在轻度综合数据基础上的再一次综合,是一种准决策数据。 轻度综合数据:是从近期基本数据中提取出的,这层数据是按时间段选取,或者按数据属性(attributes)和内容(contents)进行综合。 3、说明数据集市与数据仓库的区别与联系。 答:区别:(1)数据仓库是基于整个企业的数据模型建立的,它面向企业范围内的主。而数据集市是按照某一特定部门的数据模型建立的。 (2)部门的主题与企业的主题之间可能存在关联,也可能不存在关联。 (3)数据集市的数据组织一般采用星型模型。大型数据仓库的数据组织,如NCR公司采用第三范式。 联系:数据集市(Data Marts)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。 11、说明星形模型有什么好处。 答:大多数的数据仓库都采用“星型模型”。星型模型是由“事实表”(大表)以及多个“维表”(小表)所组成。“事实表”中存放大量关于企业的事实数据(数量数据)。星型模型在进行多维数据分析时,速度是很快的。 17、 说明数据抽取工作的内容。 答:当前值:源系统中存储的数据都代表了当前时刻的值。当商业交易时,这些数据是会发生变化的。 周期性的状态:这类数据存储的是每次发生变化时的状态。 18、 说明数据转换的基本功能。 答:选择:从源系统中选择整个记录或者部分记录。 分离/合并:对源系统中的数据进行分离操作或者合并操作。 转化:对源系统进行化和可理解化。 汇总:将最低粒度数据进行汇总。 清晰:对单个字段数据进行重新分配和简化 。 21、说明数据库中的元数据以及数据仓库中的元数据的不同。 答:元数据定义了数据仓库有什么,指明了数据仓库中数据的内容和位置,刻画了数据的抽取和转换规则,存储了与数据仓库主题有关的各种商业信息,而且整个数据仓库的运行都是基于元数据的。 数据库元数据相当于数据库系统中的数据字典。 26、数据仓库中的元数据如何发挥作用的。 答:(1)元数据告诉数据仓库中有什么数据,它们从哪里来。即如何按主题查看数据仓库的内容。 (2)元数据提供已有的可重复利用的查询语言信息。如果某个查询能够满足他们的需求,或者与他们的愿望相似,他们就可以再次使用那些查询而不必从头开始编程。 关于数据仓库使用的元数据能帮助用户到数据仓库查询所需要的信息,用于解决企业问题。 第三章 联机分析处理 1、联机分析处理(OLAP)的简单定义是什么?它体现的特征是什么? 答:联机分析处理是共享多维信息的快速分析。 它体现了四个特征: (1)快速性:用户对OLAP的快速反应能力有很高的要求。 (2)可分析性:OLAP系统应能处理任何逻辑分析和统计分析。 (3)多维性:系统必须提供对数据分析的多维视图和分析。 (4)信息性:OLAP系统应能及时获得信息,并且管理大容量的信息。 5、比较ROLAP与MOLAP在数据存储、技术及特点上的不同。 答:数据存储:ROLAP服务器需要将SQL语句转化为多维存储语句,临时“拼合”出多维数据立方体。因此,ROLAP的响应时间较长。 MOLAP在数据存储速度上性能好,响应速度快。 ROLAP使用的传统关系数据库的存储方法,在存储容量上基本没有限制。MOLAP通常采用多平面叠加成立体的方式存放数据。 技术及特点:MOLAP能够支持高性能的决策支持计算。ROLAP无法完成多行的计算和维之间的计算。 MOLAP增加新的维度,则多维数据库通常需要重新建立。ROLAP对于维表的变更有很好的适应性。 当数据频繁的变化时,MOLAP需要进行大量的重新计算,甚至重新建立索引乃至重构多维数据库。在ROLAP中灵活性较好,对于数据变化的适应性高。 ROLAP对软硬件平台的适应性很好,而MOLAP相对较差。 7、举例说明多维数据显示的两种不同方法。 产品名 时间 销售量 衣服 1月 100 衣服 2月 200 鞋 1月 150 鞋 2月 300 答: 9、举例说明四维数据显示。 答: 商店3 (页面) 上衣 裤 帽子 直接销售 固定成本 直接销售 固定成本 直接销售 固定成本 1月 450 350 550 450 500 400 2月 380 280 460 360 400 320 3月 400 310 480 410 450 400 10、举例说明六维数据显示。 答: 商店3,老年 (页面) 直接销售 间接销售 总销售 实际 计划 实际 计划 实际 计划 1月 桌子 250 300 125 150 375 450 台灯 265 320 133 160 400 480 2月 桌子 333 400 167 200 500 600 台灯 283 340 142 170 425 510 3月 桌子 350 420 175 210 525 630 台灯 250 300 125 150 375 450 12、举例说明OLAP的多维数据分析的切片操作。 答: 13、举例说明OLAP的多维数据分析的切块操作。 答: 第四章 数据仓库的与开发 1、数据仓库的需求分析的任务是什么? 答:1.确定主题域;2.支持决策的数据来源;3.数据仓库的成功标准和关键性能指标;4.数据量与更新频率 4、什么是概念模型?它的特点是什么? 答:概念模型是对真实世界中问题域内的事物的描述。 概念模型的特点是:(1)能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。 (2)易于理解,便利和用户交换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。(3)易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。(4)易于向数据仓库的数据模型(星型模型)转换。 7、 解释下图的概念模型。 答:有两个主题:商品和客户,主题也是实体。 商品有如下属性组: 商品的固有信息(商品号、商品名、类别、价格等); 商品库存信息(商品号、库房号、库存量、日期等); 商品销售信息(商品号、客户号、销售量等); 客户有如下属性组: 客户固有信息(客户号、客户名、住址、电话等); 客户购物信息(客户号、商品号、售价、购买量等)。 商品的销售信息与用户的购物信息是一致的,它们是两个主题之间的联系。 9、数据仓库的逻辑模型与数据库的逻辑模型有什么不同? 答:数据仓库逻辑模型主要工作为: (1)主题域进行概念模型(E—R图)到逻辑模型(星型模型)的转换;(2)粒度层次划分;(3)关系模式定义;(4)定义记录系统 数据库逻辑模型主要工作为: 主题域进行概念模型(E—R图)到逻辑模型(星型模型)的转换 13、什么是物理模型?数据仓库的物理模型设计包括哪些工作? 答:物理模型用来确定一个最适合应用要求的物理结构(包括存储结构和存取方法)。 包括:(1)估计存储容量;(2)确定数据的存储计划;(3)确定索引策略;(4)确定数据存放位置;(5)确定存储分配 20、说明数据仓库开发的4个阶段和12个步骤 答:1、分析与设计阶段 (①需求分析②概念设计③逻辑设计④物理设计)2、数据获取阶段(⑤数据抽取⑥数据转换⑦数据装载)3、决策支持阶段(⑧信息查询⑨知识探索)4、维护与评估阶段( eq \o\ac(○,10)数据仓库增长 eq \o\ac(○,11)数据仓库维护 eq \o\ac(○,12)数据仓库评估) 22、简要说明数据仓库开发的数据获取阶段的内容。 答:1、数据抽取:①对数据源的确认②确定数据抽取技术③确认数据抽取频率④按照时间要求抽取数据。2、数据转换:①数据格式的修正②字段的解码③单个字段的分离④信息的合并⑤变量单位的转化⑥时间的转化⑦数据汇总。3、数据装载:①初始装载②增量装载③完全刷新。 23、简要说明数据仓库开发的决策支持阶段的内容。 答:1、信息查询:①创建数据阵列②预连接表格③预聚集数据④聚类数据。2、知识探索:①发现的问题并找出原因②采用数据挖掘工具来获取商业知识。 29、数据仓库技术包括哪些内容? 答:1、管理大量数据2、数据的高效装入和数据压缩3、存储介质的管理。 第五章 数据仓库的管理与应用 1、数据仓库管理与数据库管理有什么本质不同? 答:数据仓库管理主要包括用户使用数据仓库的管理和数据管理 3、数据仓库管理主要包括哪些部分? 答:1、用户使用数据仓库的管理;2、数据管理 4、信息使用者和探索者的任务有什么不同? 答:1.信息使用者使用数据仓库的性能优化:非规格化;创建数据阵列;预连接表格;预聚集数据;聚类数据;压缩数据;定期净化数据;合并查询 2.探索者使用数据仓库的性能优化:概括分析(分析数据的完整性和准确性(数据质量)。);抽取(数据抽取的任务就是从数据仓库中抽取指定的数据,并组织起来,送入支持探索者分析的探索仓库中。);建模(通过概括分析来理解数据,通过抽取来准备数据,通过建模来分析数据。) 12、什么是休眠数据?如何产生? 答:休眠数据是那些存在于数据仓库中当前不使用,将来也很少使用或不使用的数据。 休眠数据的产生: ①在数据仓库中输入了过多的近期基本数据。 ②过多的增加了不必要的综合数据。③超过预测需求的历史数据均是休眠数据 14、什么是脏数据?如何产生? 答:脏数据是指在数据源中抽取、转换和装载到数据仓库的过程中出现的多余数据和无用数。 产生脏数据的途径: (1)开始时定义了一些多余的数据或由于一些不合适的转换规则在转换过程中产生的无用数据。(2)来自不同数据源的数据在数据结构、数据编码、数据定义等方面是不兼容的,在集成这些数据时未对所有不同情况的数据都转换成统一形式,产生遗漏或用了不匹配的转换方法而产生脏数据。(3)输入的数据已经过期。(4)用户需求的改变或数据质量有了新的要求时,那些没有适应改变要求的数据成了无用的脏数据。 22、元数据交换标准(MDIS)的作用是什么? 答:实现动态交换或同步 26、说明如何利用数据仓库找出出现问题的原因? 答:给出销售量最好的产品名单;找出出现问题的地区;追踪查找出现问题原因(向下钻取);对比其他的数据(横向钻取);显示最大的利润;当一个地区的销售低于目标值时,提出警告信息。 27、说明如何利用数据仓库进行预测? 答:数据仓库中存放了大量的历史数据,从历史数据中找出变化规律,将可以用来预测未来。在进行预测的时候需要用到一些预测模型。最常用的预测方法是采用回归模型,包括线性回归或非线性回归。 采用聚类模型或分类模型也能达到一定的预测效果。 28、数据仓库如何实现实时决策? 答:需要建立动态数据仓库(实时数据库),用于支持战术型决策,即实时决策。 战术性决策支持的重点则在企业外部,支持的是执行公司战略的员工。 29、数据仓库如何实现自动决策? 答:利用动态数据库自动决策,达到“希望发生什么”。为了寻求决策的有效性和连续性,企业就会趋向于采取自动决策。 32、利用沃尔玛数据仓库系统说明数据仓库的价值。 答:强大的数据仓库系统将世界4000多家分店的每一笔业务数据汇总到一起,让决策者能够在很短的时间里获得准确和及时的信息,并做出正确和有效的经营决策。利用数据仓库,沃尔玛对商品进行市场类组分析,即分析哪些商品顾客最有希望一起购买。沃尔玛通过数据仓库系统,决定对各个商店各色货物进行增减,确保正确的库存。 数据仓库系统不仅使沃尔玛省去了商业中介,还把定期补充库存的担子转嫁到供应商身上。沃尔玛利用数据挖掘工具和统计模型分析顾客的购买习惯、广告成功率和其他战略性的信息。数据仓库改变了沃尔玛,而沃尔玛改变了零售业。 决策信息 知识 综合信息 分析信系息 联机分析处理 综合数据1.数据库与数据仓库的本质差别是什么? 数据库用于事务处理,数据仓库用于决策分析 数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据 数据仓库的数据是大量数据库的集成 对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大 数据库 数据仓库 细节的 综合或提炼的 在存取时准确的 代表过去的数据 可更新的 不更新 一次操作数据量小 一次操作数据量大 面向应用 面向分析 支持管理 支持决策 6.说明OLTP与OLAP的主要区别。 OLTP OLAP 细节性数据 综合性数据 当前数据 历史数据 经常更新 不更新,但周期性刷新 一次性处理的数据量小 一次处理的数据量大 对响应时间要求高 响应时间合理 面向应用,事务驱动 面向分析,分析驱动 8.元数据的定义是什么? 元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。 9.元数据与数据字典的关系什么? 在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。 18.说明统计学与数据挖掘的不同。 统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。 统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。 19.说明数据仓库与数据挖掘的区别与联系。 数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。 数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。 在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。数据仓库和数据挖掘的结合对支持决策会起更大的作用。 23.数据仓库与联机分析处理、数据挖据在决策知识方面有什么不同? 数据仓库中有大量的综合数据,为决策者提供了综合信息。数据仓库保存有大量历史数据,通过预测模型计算可以得到预测信息。 联机分析处理(OLAP)对数据仓库中的数据进行多维数据分析,即多维数据的切片、切块、旋转、钻取等,得到更深层中的信息和知识。 数据挖掘(DM)技术能获取关联知识、时序知识、聚类知识、分类知识等。 数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等结合,形成决策支持系统。 综合数据1.数据库与数据仓库的本质差别是什么? 数据库用于事务处理,数据仓库用于决策分析 数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据 数据仓库的数据是大量数据库的集成 对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大 数据库 数据仓库 细节的 综合或提炼的 在存取时准确的 代表过去的数据 可更新的 不更新 一次操作数据量小 一次操作数据量大 面向应用 面向分析 支持管理 支持决策 6.说明OLTP与OLAP的主要区别。 OLTP OLAP 细节性数据 综合性数据 当前数据 历史数据 经常更新 不更新,但周期性刷新 一次性处理的数据量小 一次处理的数据量大 对响应时间要求高 响应时间合理 面向应用,事务驱动 面向分析,分析驱动 8.元数据的定义是什么? 元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。 9.元数据与数据字典的关系什么? 在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。 18.说明统计学与数据挖掘的不同。 统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。 统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。 19.说明数据仓库与数据挖掘的区别与联系。 数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。 数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。 在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。数据仓库和数据挖掘的结合对支持决策会起更大的作用。 23.数据仓库与联机分析处理、数据挖据在决策知识方面有什么不同? 数据仓库中有大量的综合数据,为决策者提供了综合信息。数据仓库保存有大量历史数据,通过预测模型计算可以得到预测信息。 联机分析处理(OLAP)对数据仓库中的数据进行多维数据分析,即多维数据的切片、切块、旋转、钻取等,得到更深层中的信息和知识。 数据挖掘(DM)技术能获取关联知识、时序知识、聚类知识、分类知识等。 数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等结合,形成决策支持系统。 综合数据1.数据库与数据仓库的本质差别是什么? 数据库用于事务处理,数据仓库用于决策分析 数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据 数据仓库的数据是大量数据库的集成 对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大 数据库 数据仓库 细节的 综合或提炼的 在存取时准确的 代表过去的数据 可更新的 不更新 一次操作数据量小 一次操作数据量大 面向应用 面向分析 支持管理 支持决策 6.说明OLTP与OLAP的主要区别。 OLTP OLAP 细节性数据 综合性数据 当前数据 历史数据 经常更新 不更新,但周期性刷新 一次性处理的数据量小 一次处理的数据量大 对响应时间要求高 响应时间合理 面向应用,事务驱动 面向分析,分析驱动 8.元数据的定义是什么? 元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。 9.元数据与数据字典的关系什么? 在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。 18.说明统计学与数据挖掘的不同。 统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。 统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。 19.说明数据仓库与数据挖掘的区别与联系。 数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。 数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。 在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。数据仓库和数据挖掘的结合对支持决策会起更大的作用。 23.数据仓库与联机分析处理、数据挖据在决策知识方面有什么不同? 数据仓库中有大量的综合数据,为决策者提供了综合信息。数据仓库保存有大量历史数据,通过预测模型计算可以得到预测信息。 联机分析处理(OLAP)对数据仓库中的数据进行多维数据分析,即多维数据的切片、切块、旋转、钻取等,得到更深层中的信息和知识。 数据挖掘(DM)技术能获取关联知识、时序知识、聚类知识、分类知识等。 数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等结合,形成决策支持系统。 元数据 本质差别是什么? 数据库用于事务处理,数据仓库用于决策分析 数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据 数据仓库的数据是大量数据库的集成 对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大 数据库 数据仓库 细节的 综合或提炼的 在存取时准确的 代表过去的数据 可更新的 不更新 一次操作数据量小 一次操作数据量大 面向应用 面向分析 支持管理 支持决策 6.说明OLTP与OLAP的主要区别。 OLTP OLAP 细节性数据 综合性数据 当前数据 历史数据 经常更新 不更新,但周期性刷新 一次性处理的数据量小 一次处理的数据量大 对响应时间要求高 响应时间合理 面向应用,事务驱动 面向分析,分析驱动 8.元数据的定义是什么? 元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。 9.元数据与数据字典的关系什么? 在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。 18.说明统计学与数据挖掘的不同。 统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。 统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。 19.说明数据仓库与数据挖掘的区别与联系。 数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。 数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。 在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。数据仓库和数据挖掘的结合对支持决策会起更大的作用。 23.数据仓库与联机分析处理、数据挖据在决策知识方面有什么不同? 数据仓库中有大量的综合数据,为决策者提供了综合信息。数据仓库保存有大量历史数据,通过预测模型计算可以得到预测信息。 联机分析处理(OLAP)对数据仓库中的数据进行多维数据分析,即多维数据的切片、切块、旋转、钻取等,得到更深层中的信息和知识。 数据挖掘(DM)技术能获取关联知识、时序知识、聚类知识、分类知识等。 数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等结合,形成决策支持系统。 数据挖掘1.数据库与数据仓库的本质差别是什么? 数据库用于事务处理,数据仓库用于决策分析 数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据 数据仓库的数据是大量数据库的集成 对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大 数据库 数据仓库 细节的 综合或提炼的 在存取时准确的 代表过去的数据 可更新的 不更新 一次操作数据量小 一次操作数据量大 面向应用 面向分析 支持管理 支持决策 6.说明OLTP与OLAP的主要区别。 OLTP OLAP 细节性数据 综合性数据 当前数据 历史数据 经常更新 不更新,但周期性刷新 一次性处理的数据量小 一次处理的数据量大 对响应时间要求高 响应时间合理 面向应用,事务驱动 面向分析,分析驱动 8.元数据的定义是什么? 元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。 9.元数据与数据字典的关系什么? 在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。 18.说明统计学与数据挖掘的不同。 统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。 统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。 19.说明数据仓库与数据挖掘的区别与联系。 数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。 数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。 在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。数据仓库和数据挖掘的结合对支持决策会起更大的作用。 23.数据仓库与联机分析处理、数据挖据在决策知识方面有什么不同? 数据仓库中有大量的综合数据,为决策者提供了综合信息。数据仓库保存有大量历史数据,通过预测模型计算可以得到预测信息。 联机分析处理(OLAP)对数据仓库中的数据进行多维数据分析,即多维数据的切片、切块、旋转、钻取等,得到更深层中的信息和知识。 数据挖掘(DM)技术能获取关联知识、时序知识、聚类知识、分类知识等。 数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等结合,形成决策支持系统。 数据库 库与数据仓库的本质差别是什么? 数据库用于事务处理,数据仓库用于决策分析 数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据 数据仓库的数据是大量数据库的集成 对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大 数据库 数据仓库 细节的 综合或提炼的 在存取时准确的 代表过去的数据 可更新的 不更新 一次操作数据量小 一次操作数据量大 面向应用 面向分析 支持管理 支持决策 6.说明OLTP与OLAP的主要区别。 OLTP OLAP 细节性数据 综合性数据 当前数据 历史数据 经常更新 不更新,但周期性刷新 一次性处理的数据量小 一次处理的数据量大 对响应时间要求高 响应时间合理 面向应用,事务驱动 面向分析,分析驱动 8.元数据的定义是什么? 元数据(metadata)定义为关于数据的数据(data about data),即元数据描述了数据仓库的数据和环境。 9.元数据与数据字典的关系什么? 在数据仓库中引入了“元数据”的概念,它不仅仅是数据仓库的字典,而且还是数据仓库本身信息的数据。 18.说明统计学与数据挖掘的不同。 统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等),进行数值计算(如初等运算)的定量分析,得到数量信息。 数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。 统计学与数据挖掘是有区别的。但是,它们之间是相互补充的。 19.说明数据仓库与数据挖掘的区别与联系。 数据仓库是一种存储技术,它能适应于不同用户对不同决策需要提供所需的数据和信息。 数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。 数据仓库与数据挖掘都是决策支持新技术。但它们有着完全不同的辅助决策方式。 在数据仓库系统的前端的分析工具中,数据挖掘是其中重要工具之一。它可以帮助决策用户挖掘数据仓库的数据中隐含的规律性。数据仓库和数据挖掘的结合对支持决策会起更大的作用。 23.数据仓库与联机分析处理、数据挖据在决策知识方面有什么不同? 数据仓库中有大量的综合数据,为决策者提供了综合信息。数据仓库保存有大量历史数据,通过预测模型计算可以得到预测信息。 联机分析处理(OLAP)对数据仓库中的数据进行多维数据分析,即多维数据的切片、切块、旋转、钻取等,得到更深层中的信息和知识。 数据挖掘(DM)技术能获取关联知识、时序知识、聚类知识、分类知识等。 数据仓库(DW)、联机分析处理(OLAP)、数据挖掘(DM)等结合,形成决策支持系统。 � EMBED Unknown ��� � EMBED PBrush ��� � EMBED Word.Document.8 \s ��� 客户固 有信息 � EMBED PBrush ��� 客户 商品库存信息 商品号 商品固 有信息 商品 客户号 � 决策用户 数据仓库 PAGE 2 _1362337896.doc 元数据 历史数据层 当前基本数据层 高度综合数据层 轻度综合数据层 _1362295497.doc
/
本文档为【数据仓库与数据挖掘技术课后作业】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索