为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > spss基本操作

spss基本操作

2019-07-22 91页 ppt 4MB 64阅读

用户头像 个人认证

阳卫

人民教师

举报
spss基本操作一、SPSS基础二、SPSS数据文件的建立三、spss数据整理四、描述统计五、方差分析六、统计推断SPSS的启动SPSS的主要窗口SPSS软件运行过程中会出现多个界面,各个界面用处不同。其中,最主要的界面有三个:数据编辑窗口结果输出窗口语句窗口(1)数据编辑窗口启动SPSS后看到的第一个窗口便是数据编辑窗口,如图所示。在数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑,是SPSS的基本界面。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。标题栏:显示数据编辑的数据...
spss基本操作
一、SPSS基础二、SPSS数据文件的建立三、spss数据整理四、描述统计五、方差分析六、统计推断SPSS的启动SPSS的主要窗口SPSS软件运行过程中会出现多个界面,各个界面用处不同。其中,最主要的界面有三个:数据编辑窗口结果输出窗口语句窗口(1)数据编辑窗口启动SPSS后看到的第一个窗口便是数据编辑窗口,如图所示。在数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑,是SPSS的基本界面。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。标题栏:显示数据编辑的数据文件名。菜单栏:通过对这些菜单的选择,用户可以进行几乎所有的SPSS操作。关于菜单的详细的操作步骤将在后续实验内容中分别介绍。为了方便用户操作,SPSS软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另外,如果用户对系统预设的工具栏设置不满意,也可以用[视图]→[工具栏]→[设定]命令对工具栏按钮进行定义。编辑栏:可以输入数据,以使它显示在内容区指定的方格里。变量名栏:列出了数据文件中所包含变量的变量名观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。窗口切换标签:用于“数据视图”和“变量视图”的切换。即数据浏览窗口与变量浏览窗口。数据浏览窗口用于样本数据的查看、录入和修改。变量浏览窗口用于变量属性定义的输入和修改。状态栏:用于说明显示SPSS当前的运行状态。SPSS被打开时,将会显示“PASWStatisticsProcessor”的提示信息。(2)结果输出窗口在SPSS中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。窗口右边部分显示统计分析结果,左边是导航窗口,用来显示输出结果的目录,可以通过单击目录来展开右边窗口中的统计分析结果。当用户对数据进行某项统计分析,结果输出窗口将被自动调出。当然,用户也可以通过双击后缀名为.spo的SPSS输出结果文件来打开该窗口。SPSS数据文件的建立可以利用【File(文件)】菜单中的命令来实现。具体来说,SPSS提供了四种创建数据文件的方法: 新建数据文件; 直接打开已有数据文件; 使用数据库查询; 从文本向导导入数据文件。SPSS数据文件的建立打开SPSS软件后,现在菜单栏中的【File(文件)】→【New(新建)】→【Data(数据)】命令,可以创建一个新的SPSS空数据文件。接着,用户可以进行直接录入数据等后续工作。值得注意的是,SPSS19.0可以同时打开多个数据文件,用户可以在多个文件中进行转换操作,这比起低版本的SPSS来说,更方便用户使用。(1)新建数据文件第一步:定义变量输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。单击数据编辑窗口左下方的“VariableView”标签或双击列的题头(Var),进入如图2-2所示的变量定义视图窗口,在此窗口中即可定义变量。变量的定义信息在图所示的窗口中每一行表示一个变量的定义信息,包括Name(变量名)、Type(变量类型)、Width(变量格式宽度)、Decimal(变量小数位)、Label(变量名标签)、Values(变量值标签)、Missing(变量缺失值)、Columns(变量列宽)、Align(变量对齐方式)、Measure(变量测度水平)等。变量名(Name)是变量存取的唯一标志。在定义SPSS数据属性时应首先给出每列变量的变量名。变量命名应遵循下列基本规则:●SPSS变量长度不能超过64个字符(32个汉字);●首字母必须是字母或汉字;●变量名的结尾不能是圆点、句号或下划线;●变量名必须是唯一的;●变量名不区分大小写;●SPSS的保留字不能作为变量名,例如ALL、NE、EQ和AND等;●如果用户不指定变量名,SPSS软件会以“VAR”开头来命名变量,后面跟5个数字,如VAR00001、VAR00019等。注意:为了方便记忆,用户所取的变量名最好与其代表的数据含义相对应。变量名:Name变量类型:Type单击Type相应单元中的按钮,弹出如图2-3所示的对话框,在对话框中选择合适的变量类型并单击“OK”按钮,即可定义变量类型。SPSS提供了三种基本数据类型:数值型、字符型和日期型。注意:设置变量的长度,当变量为日期型时无效。变量格式宽度With是指在数据窗口中变量列所占的单元格的列宽度,一般用户采用系统默认选项即可。值得注意的是,如果变量宽度大于变量格式宽度,此时数据窗口中显示变量名的字符数不够,变量名将被截去尾部作不完全显示。被截去的部分用“*”号代替。变量格式宽度:With栏变量小数点位数:Decimal设置变量的小数点位数,系统默认为两位。当变量为日期型时无效。变量标签:Label变量标签是对变量名的进一步描述,变量只能由不超过8个字符组成,而8个字符经常不足以表示变量的含义。而变量标签可长达120个字符,变量标签可显示大小写,需要时可用变量标签对变量名的含义加以解释。同时该属性可以省略,但建议最好给出变量名的标签。•变量值标签(Values)是对变量的可能的取值的含义进行进一步说明。变量值标签特别对于数值型变量表示非数值型变量时尤其有用。•定义和修改变量值标签,可以双击要修改值的单元格,在弹出的对话框的【Values(值)】文本框中输入变量值,在【Label(标签)】文本框中输入变量值标签,然后单击【Add(添加)】按钮将对应关系选入下边的白框中。同时,可以单击【Change(改变)】和【Remove(移动)】按钮对已有的标签值进行修改和剔除。最后单击【OK(确定)】按钮返回主界面。变量值标签:Values栏缺失值的定义方式:MissingSPSS有两类缺失值:系统缺失值和用户缺失值。单击Missing相应单元中的按钮,在弹出的如图2-5所示的对话框中可改变缺失值的定义方式,在SPSS中有两种定义缺失值的方式。可以定义3个单独的缺失值。可以定义一个缺失值范围和一个单独的缺失值。变量的显示宽度:Columns输入变量的显示宽度,默认为8。变量显示的对齐方式:Align选择变量值显示时的对齐方式:Left(左对齐)、Right(右对齐)、Center(居中对齐)。默认是右对齐。变量的测量尺度:Measure 变量按测量精度可以分为定性变量、定序变量、定距变量和定比变量几种。SPSS将其分为定距变量(Scale)、定序变量(Ordinal)、定类变量(Nominal)。 定距变量:年龄、温度、重量、次数等,包括连续变量和不连续变量。 定序变量:职称(高下)、程度(高低)等。 定类变量:职业、性别等。实例:16种饮料的热量、咖啡因、钠及价格•打开SPSS软件后,现在菜单栏中的【File(文件)】→【Open(打开)】→【Data(数据)】命令,弹出【OpenData(打开数据)】对话框。选中需要打开的数据类型和文件名,双击打开该文件。(2)直接打开已有数据文件弹出的对话框中的【Readvariablenamesfromthefirstrowofdate(从第一行数据读取变量名)】复选框表示SPSS将Excel工作表的第一行设定为SPSS的变量名称,【Range(范围)】文本框表示选定Excel文件导入SPSS的数据范围。这里,保持系统默认选项。最后,单击【OK(确定)】按钮,数据即可导入成功。此时,SPSS的数据浏览窗口中会出现相关的数据内容。实例:全国31个省市的8大经济指标.xls•打开软件后,现在菜单栏中的【File(文件)】→【OpenDatabase(打开数据库)】→【NewQuery(新建查询)】命令,弹出【DatabaseWizard(数据库向导)】对话框。通过这个数据库向导窗口,用户可以选择需要打开的文件类型,并按照窗口上的提示进行相关操作。(3)利用数据库导入数据•SPSS提供了专门读取文本文件的功能。打开软件后,现在菜单栏中的【File(文件)】→【ReadTextData(打开文本数据)】命令,弹出【OpenData(打开数据)】对话框。这里用户需要选择需要打开的文件名称,并且单击【Open(打开)】按钮进入文本文件向导窗口。(4)文本向导导入数据SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。在数据保存对话框(如图2.5所示)中根据不同要求进行SPSS数据保存。SPSS数据的保存通常情况下,刚刚建立的数据文件并不能立即进行统计分析,这是因为收集到的数据还是原始数据,还不能直接利用分析。此时,需要对原始数据进行进一步的加工、整理,使之更加科学、系统和合理。这项工作在数据分析中称之为统计整理。•【Data(数据)】菜单中的命令主要用于实现数据文件的整理功能。spss数据整理Step01:打开观测量排序对话框打开SPSS软件,选择菜单栏中的【File(文件)】→【Data(数据)】→【SortCases(排序个案)】命令,弹出【SortCases(排序个案)】对话框。观测量排序Step02:选择排序变量在左侧的候选变量列表框中选择主排序变量,单击右向箭头按钮,将其移动至【Sortby(排序依据)】列表框中。Step03:选择排序类型在【SortOrder(排列顺序)】选项组中可以选择变量排列。Step04:单击【OK】按钮,此时操作结束。实例:全国31个省市的8大经济指标数据的转置Step01:打开转置对话框打开SPSS软件,选择菜单栏中的【File(文件)】→Data(数据)】→【Transpose(转置)】命令,弹出【Transpose(转置)】对话框。Step02:选择转置变量在左侧的候选变量列表框中选择需要进行转置的变量,单击右向箭头按钮,将其移动至【Variable(s)(变量)】列表框中。Step03:新变量命名从左侧的候选变量列表框中可以选择一个变量,应用它的值作为转置后新变量的名称。此时,选择该变量进入【NameVariable(名称变量)】列表框内即可。如果用户不选择变量命名,则系统将自动给转置后的新变量赋予Var001、Var002…的变量名。Step04:单击【OK】按钮,操作结束。注意:数据文件转置后,数据属性的定义都会丢失,因此用户要慎重选择本功能。实例内容:国家财政分项目收入数据Step1:选定对话框Step2:选择转置变量Step3:新变量命名Step4:完成操作国家财政分项目收入数据.sav•【data(数据)】→【MergeFiles(合并文件)】菜单中有两个命令选项:【AddCases(添加个案)】和【AddVariables(添加变量)】。文件合并观测量合并要求两个数据文件至少应具有一对属性相同的变量,即使它们的变量名不同。具体步骤如下。Step01:打开观测量合并对话框选择菜单栏中的【File(文件)】→【Data(数据)】→【MergeFiles(合并文件)】→【AddCases(添加个案)】命令,弹出【AddCases(添加个案)】对话框Step02:选择合并文件点选【AnexternalSPSSStatisticsdatafile(外部SPSSStatistics数据文件)】单选钮,同时单击【Browse】按钮,选中需要合并的文件,并指定文件路径,然后单击【Continue】按钮。Step03:选择合并方法。Step04:单击【OK】按钮,操作结束。变量合并要求两个数据文件必须具有一个共同的关键变量(KeyVariable),而且这两个文件中的关键变量还具有一定数量的相同的观测量数值。•Step01:打开变量合并对话框。•Step02:选择合并文件。•Step03:选择合并方法。•Step04:单击【OK】按钮,操作结束。在对数据文件中的数据进行统计分析的过程中,为了更有效地处理数据和反映事务的本质,有时需要对数据文件中的变量加工产生新的变量。比如经常需要把几个变量加总或取加权平均数,SPSS中通过【计算】菜单命令来产生这样的新变量,其步骤如下:选择菜单【转换】→【计算变量】,打开对话框,如图2.14所示。计算新变量 在目标变量输入框中输入生成的新变量的变量名。单击输入框下面类型与标签按钮,在跳出的对话框中可以对新变量的类型和标签进行设置。 在数字表达式输入框中输入新变量的计算表达式。例如“年龄>20”。 单击【如果】按钮,弹出子对话框,如图2.15所示。包含所有个体:对所有的观测进行计算;如果个案满足条件则包括:仅对满足条件的观测进行计算。 单击Ok按钮,执行命令,则可以在数据文件中看到一个新生成的变量。描述统计1.频数分析(Frequencies)基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。SPSS中的频数分布表包括的内容有:(1)频数(Frequency)即变量值落在某个区间中的次数。(2)百分比(Percent)即各频数占总样本数的百分比。(3)有效百分比(ValidPercent)即各频数占有效样本数的百分比。这里有效样本数=总样本-缺失样本数。(4)累计百分比(CumulativePercent)即各百分比逐级累加起来的结果。最终取值为百分之百。频数分析的第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。频数分析中常用的统计图包括:条形图,饼图,直方图等。 选择菜单“【分析】—>【描述统计】—>【频率】”。如图2.1所示频数分析的应用步骤 确定所要分析的变量,例如年龄 在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图2.2所示,选择统计输出选项。 点击Frequencies对话框中的“OK”按钮,即得到下面的结果。实例:全国31个省市的8大经济指标SPSS的【描述】命令专门用于计算各种描述统计性统计量。具体操作步骤如下:选择菜单【分析】→【描述统计】→【描述】,将待分析的变量移入Variables列表框描述统计(Descriptives)Savestandardizedvaluesasvariables:对所选择的每个变量进行化处理,产生相应的Z分值,作为新变量保存在数据窗口中。其变量名为相应变量名前加前缀z。标准化计算:单击【选项】按钮,如图所示,选择需要计算的描述统计量。各描述统计量同Frequencies命令中的Statistics子对话框中大部分相同,这里不再重复。实例:全国31个省市的8大经济指标调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,对数据分析更进一步。探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。一般以图形方式输出,直观帮助研究者确定奇异值、影响点、还可以进行假设检验,以及确定研究者要使用的某种统计方式是否合适。在打开的数据文件上,选择如下命令:选择菜单“【分析】—>【描述统计】—>【探索】”,打开对话框。探索分析(Explore)选择分析变量:在【Explore(探索)】对话框左侧的【候选变量】清单中,选取一个或多个待分析变量,将它们移入右侧的【DependentList(因变量列表)】列表框中,表示要进行探索性分析的变量。选择分组变量:在【Explore(探索)】对话框的候选变量列表框中,可以选取一个或多个分组变量,将它们移入右侧的【FactorList(因子列表)】列表框中。分组变量的选择可以将数据按该变量中的观测值进行分组分析。如果选择的分组变量不止一个,那么会以分组变量的不同取值进行组合分组。选择输出类型在【Explore(探索)】对话框下面的【Display】选项组中可以选择输出项。●Both:输出图形以及描述性统计量。●Statistics:只输出描述统计量。选择此项后激活【Statistics】功能按钮。●Plots:只输出图形。选择此项后激活【Plots】功能按钮。选择标签值:从候选变量列表框中选择一个变量作为标识变量,并将其移入【LabelCasesby(标注个案)】列表框中。选择标识变量的作用在于,若系统在数据探索时发现异常值,便可利用标识变量加以标记,便于用户找这些异常值。如果不选择它,系统默认以id变量作为标识变量。描述性统计量结果输出在【Explore(探索)】对话框中还可以单击【Statistics】按钮,弹出【Explore:Statistics】对话框,该对话框中提供了各类基本描述性统计输出结果。统计图形结果输出在【Explore(探索)】对话框中还可以单击【Plots】按钮,弹出【Explore:Plots】对话框。该对话框中提供了图形输出的类型。单击【OK】按钮,结束操作,SPSS软件自动输出结果。茎叶图描述茎叶图自左向右可以分为3大部分:频数(Frequency)、茎(Stem)和叶(Leaf)。茎表示数值的整数部分,叶表示数值的小数部分。每行的茎和每个叶组成的数字相加再乘以茎宽(StemWidth),即茎叶所表示的实际数值的近似值。实例:全国城市平均温度分布箱图描述图中灰色区域的方箱为箱图的主体,上中下3条线分别表示变量值的第75、50、25百分位数,因此变量的50%观察值落在这一区域中。方箱中的中心粗线为中位数。箱图中的触须线是中间的纵向直线,上端截至线为变量的最大值,下端截至线为变量的最小值。统计推断1.单个总体均值的区间估计 打开SPSS,建立数据文件:“电视节目市场调查.sav”。这里,研究变量为:time,即每天看电视的时间。 选择区间估计选项,方法如下:选择菜单【分析】—>【描述统计】—>【探索】”,打开探索对话框。 从源变量清单中将“time”变量移入因变量列表框中。 单击上图右方的“统计量”按钮打开“探索:统计量”对话框。在设置均值的置信水平,如键入95%,完成后单击“继续”按钮回到主窗口。 返回主窗口点击ok运行操作。如上表显示。从上表“95%ConfidenceIntervalforMean”中可以得出,每晚8:30开始的半小时内广告所占时间区间估计(置信度为95%)为:(6.2529,6.8171),其中lowerBound表示置信区间的下限,UpperBound表示置信区间的上限。点估计是:6.5350。软件使用方法(1)在SPSS中,软件将自动计算t值,由于该统计量服从n-1个自由度的t分布,SPSS将根据t分布表给出t值对应的相伴概率P值。(2)如果相伴概率P值小于或等于给定的显著性水平(一般取0.05),则拒绝H0,认为总体均值与检验值之间存在显著差异。(3)相反,相伴概率值大于给定的显著性水平,则不应拒绝H0,可以认为总体均值与检验值之间不存在显著差异。假设检验2.单个总体均值的假设检验(单样本T检验)单样本t检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在明显的差异。它是对总体均值的假设检验。某种品牌的沐浴肥皂制造程序的规格中要求每批平均生产120块肥皂,高于或低于该数量均被认为是不合理的,在由10批产品所组成的一个样本中,每批肥皂的产量数据见下表,在0.05的显著水平下,检验该样本结果能否说明制造过程运行良好?判断检验类型该例属于“大样本、总体标准差σ未知。假设形式为:H0:μ=μ0,H1:μ≠μ0软件实现程序打开已知数据文件,然后选择菜单“【分析】→【比较均值】→单样本T检验”,打开One-SampleTTest对话框。从源变量清单中将“产品数量”向右移入“TestVariables”框中。在“TestValue”框里输入一个指定值(即假设检验值,本例中假设为120),T检验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设。“One-SampleTTest”窗口中“OK”按钮,输出结果如下表所示。(1)“One-SampleStatistics”(单个样本的统计量)表分别给出样本的容量、均值、标准差和平均标准误。本例中,产品数量均值为118.9000。(2)“One-SampleTest”(单个样本的检验)表表中的t表示所计算的T检验统计量的数值,本例中为-0.705。表中的“df”,表示自由度,本例中为9。表中的“Sig”(双尾T检验),表示统计量的P-值,并与双尾T检验的显著性的大小进行比较:Sig.=0.498>0.05,说明这批样本的平均产量与120无显著差异。表中的“MeanDifference”,表示均值差,即样本均值与检验值120之差,本例中为-1.1000。表中的“95%ConfidenceInternaloftheDifference”,样本均值与检验值偏差的95%置信区间为(-4.628,2.428),置信区间包括数值0,说明样本数量与120无显著差异,符合要求。实例:交通通勤时间根据一份公共交通调查报告显示,对于那些在一个城市乘车上下班的人来说,平均通勤时间为19分钟,其人数总量为100万—300万。假设一个研究者居住在一个人口为240万的城市里,想通过验证以确定通勤时间是否和其他城市平均水平是否一致。他随机选取了26名通勤者作为样本,收集的数据如下所示。这位研究者能得到什么结论?1916202323241319231617151427172318182018181823191928结果:SPSS规定:当样本含量3≤n≤5000时,结果以Shapiro-Wilk(W检验)为准;当样本含量n>5000结果以Kolmogorov-Smirnov为准。注意:由于单样本t检验要求样本数据服从正态分布,因此先进行正态检验。方法:1.分析—描述性统计—探索性;2.选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图和直方图,选择输出正态性检验图表,注意显示(Display)要选择双项(Both)。交通通勤时间.savN=26,所以采用Shapiro-Wilk检验的p值0.245>0.05,因此样本符合正态分布。直方图验证了上述检验结果。P=0.471>0.05:无显著差异Step01:打开两独立样本t检验对话框。选择菜单栏中的【Analyze(分析)】→【CompareMeans(比较均值)】→【Independent-SamplesTTest(独立样本T检验)】命令,弹出【Independent-SamplesTTest(独立样本T检验)】对话框。3.两独立样本t检验Step02:选择检验变量•在左侧的候选变量列表框中选择检验变量,将其移入【TestVariable(s)(检验变量)】列表框中,这里需要选入待检验的变量。Step03:选择分组变量在左侧的候选变量列表框中选择分组变量,将其移入【GroupingVariable(分组变量)】文本框中,目的是区分检验变量的不同组别。Step04定义组别名称单击【DefineGroups】按钮,弹出【DefineGroups(定义组)】对话框,此时需要定义进行t检验的比较组别名称。该对话框中各选项的含义如下。Usespecifiedvalues:分别输入两个对应不同总体的变量值。Cutpoint:用于定义分割点值。在该文本框中输入一个数字,大于等于该数值的对应一个总体,小于该值的对应另一个总体。Step05单击【OK】按钮,结束操作,SPSS软件自动输出相关结果。实例图文分析:机场等级分数比较国际航空运输协会(TheInternationalAirTransportAssociation)对商务旅游人员进行了一项调查,以便确定多个国际机场的等级分数。最高可能分数是10分,分数越高说明其等级也越高。假设有一个由50名商务旅行人员组成的简单随机样本,要求这些人给迈阿密机场打分。另外有一个由50名商务旅行人员组成的样本,要求这些人给洛杉矶机场打分。这两个组人员打出的等级分数如表4-5所示。请你判断迈阿密机场和洛杉矶机场的等级评分是否相同?实例操作本案例中共有两组商务旅行人员分别对迈阿密和洛杉矶机场打分。由于这两组人员构成不同,因此由这两组人员组成的样本可以看作是相互独立的。现在要比较这两个机场的平均得分是否相同,也就是要检验这两个独立样本的均值是否相同,因此可以采用两独立样本t检验的方法。于是建立如下假设检验:H0:迈阿密机场和洛杉矶机场的等级得分相同。H1:迈阿密机场和洛杉矶机场的等级得分不同。实例:机场分数等级.sav②两总体均值的检验在SPSS中进行两独立样本t检验时,应首先对F检验作判断。如果方差相等,观察分析结果中Equalvariancesassumed列的t检验相伴概率值;如果方差不相等,观察Equalvariancesnotassumed列的t检验相伴概率值。本案例的第一步分析中,由于两总体方差无显著差异,因此应看第一列(Equalvarianceassumed)的t检验结果。具体来说,t统计量的观测值为-0.924,对应的双尾概率P值为0.358,大于显著性水平0.05,因此认为两总体的均值不存在显著差异,即迈阿密机场和洛杉矶机场的等级得分相同。这个结论说明商务人员认为两个机场在服务水平质量等方面是没有差异的。①两总体方差是否相等的F检验F统计量的观察值为0.086,对应的概率P值为0.770。由于系统默认显著性水平α为0.05,而概率P值显然大于0.05,因此认为两总体的方差无显著性差异。实例2:南北城市温度差异.sav(1)使用目的前一节中考虑的是独立样本情形下的总体均值相等的检验问题。但在现实中,总体或样本之间不仅仅表现为独立的关系,很多情况下,总体之间存在着一定的相关性。当分析这些相关总体之间的均值关系时,就涉及到两配对样本的t检验。4.两配对样本t检验的基本原理注:配对样本是对应独立样本而言的,配对样本是指一个样本在不同时间做了两次试验,或者具有两个类似的,从而比较其差异;独立样本检验是指不同样本平均数的比较,而配对样本检验往往是对相同样本二次平均数的检验。(3)使用条件进行配对样本检验时,通常要满足以下三个要求。 两组样本的样本容量要相同; 两组样本的观察值顺序不能随意调换,要保持一一对应关系; 样本来自的总体要服从正态分布。(2)基本原理两配对样本t检验的目的是利用来自两个总体的配对样本,推断两个总体的均值是否存在显著差异。它和独立样本t检验的差别就在于要求样本是配对的。由于配对样本在抽样时不是相互独立的,而是相互关联的,因此在进行统计分析时必须要考虑到这种相关性,否则会浪费大量的统计信息,因此对于符合配对情况的统计问题,要首先考虑两配对样本t检验。配对样本主要包括下列一些情况。两配对样本t检验的SPSS操作详解Step01:打开两配对样本t检验对话框选择菜单栏中的【Analyze(分析)】→【CompareMeans(比较均值)】→【Paired-SamplesTTest(配对样本T检验)】命令,弹出【Paired-SamplesTTest(配对样本T检验)】对话框。Step02:选择配对变量在【配对样本T检验】对话框左侧的候选变量列表框中选择一对或几对变量,将其移入【成对变量】列表框中,这表示系统将对移入的成对变量进行配对检验。Step03:单击图【OK】按钮,结束操作,SPSS软件自动输出结果。实例图文分析:看电视和读书的时间“每月读书俱乐部”的成员进行了一项调查,以确信其成员用于看电视的时间是否比读书的时间多。假定抽取了15个人组成的样本,得到了下列有关他们每周观看电视的小时数和每周读书时间的小时数的数据,见表所示。你能够得到结论:“每月读书俱乐部”的成员每周观看电视的时间比读书的时间更多吗?实例图文分析:看电视和读书的时间.sav上述两个表给出了tv和book的均值、标准差、均值标准误差以及tv和book的相关系数。成对样本相关系数表是进行两配对变量之间简单相关性分析结果输出表。表中第2列表示样本容量,第3列表示看电视时间和看书时间的简单相关系数,第4列表示概率P值。从结果来看,“tv”和“book”变量的相关系数等于0.193,呈简单正相关关系。从表3可以看出临界置信水平为0.036,小于0.05。说明两组评酒员的评价结果有显著性差异。 从表3可以看出临界置信水平为0.036,小于0.05。说明两组评酒员的评价结果有显著性差异。 表中给出了配对样本t检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的95%置信度下的区间估计。当然也给出了最为重要的t统计量和p值。结果显示p=0.043<0.05,所以看电视和看书时间有显著性差异。方差分析方差分析有3个基本的概念:观测变量、因素和水平。观测变量是进行方差分析所研究的对象;因素是影响观测变量变化的客观或人为条件;因素的不同类别或不通取值则称为因素的不同水平。在方差分析中,因素常常是某一个或多个离散型的分类变量。在前面中我们讨论了如何对一个总体及两个总体的均值进行检验,如我们要确定两种销售方式的效果是否相同,可以对零假设进行检验。但有时销售方式有很多种,这就是多个总体均值是否相等的假设检验问题了,所采用的方法是方差分析。根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;根据因素个数,可分为单因素方差分析和多因素方差分析。在SPSS中,有One-wayANOVA(单变量-单因素方差分析)、GLMUnivariate(单变量多因素方差分析);GLMMultivariate(多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。单因素单变量方差分析基本原理方差分析认为:SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和)如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动主要由随机变量因素引起的。SPSS将自动计算检验统计量和相伴概率P值,若P值小于等于显著性水平α,则拒绝原假设,认为因素的不同水平对观测变量产生显著影响;反之,接受零假设,认为因素的不同水平没有对观测变量产生显著影响。Step01:打开主操作窗口选择菜单栏中的【Analyze(分析)】→【CompareMeans(比较均值)】→【One-WayANOVA(单因素ANOVA)】命令,弹出【One-WayANOVA(单因素ANOVA)】对话框,这是单因素方差分析的主操作窗口。Step02:选择因变量在【One-WayANOVA(单因素ANOVA)】对话框的候选变量列表框中选择一个或几个变量,将其添加至【DependentList(因变量列表)】列表框中,选择的变量就是要进行方差分析的观测变量(因变量)。单因素方差分析的SPSS操作详解Step03:选择因素变量在【One-WayANOVA(单因素ANOVA)】对话框的候选变量列表框中选择一个变量,将其添加至【Factor(因子)】列表框中,选择的变量就是要进行方差分析的因素变量。Step04:均值精细比较单击【Contrasts】按钮,弹出如右图所示的【Contrasts(对比)】对话框。Step05:均值多重比较单击【PostHoc】按钮,弹出如下图所示的【PostHocMultipleComparisons(两两比较)】对话框,该对话框用于设置均值的多重比较检验。实例:股票基金的费用比率Money杂志报告了股票和债券基金的收益和费用比率。10种中等规模的资本股票基金、10种小额资本股票基金、10种混合型股票基金和10种专项股票基金的费用比率的数据见表5-5所示(单位:%)。(1)请检验这4种类型股票基金之间的平均费用比率的差异性。(2)混合型股票基金的费用比率是其他三种类型基金费用比率的平均水平吗?默认选择【Linear(线性)】选项,表示要进行均值的精细比较。接着在【Coefficients(系数)】文本框中依次输入线性多项式的系数“1”、“1”、“-3”和“1”【PostHoc(两两比较)】对话框。由于这里已计划好对这4组均值进行两两比较,则在其对话框中勾选【LSD】复选框。股票基金的费用比率.sav描述性统计量表SPSS的结果报告中首先输出了描述性统计量,如表所示。首先,中等规模的资本股票基金的平均费用比率最低,而专项股票基金的平均费用比率最高,但各类型基金的平均值差距不大。其次,从标准差大小来看,中等规模的资本股票基金最低,而混合型股票基金最高。最后,表还列出了各种类型基金的最大值、最小值及95%水平的置信区间。由于概率P值0.135大于显著性水平0.05,故认为这四种类型基金费用比率的方差是相同的,满足方差分析的前提条件可以看到,费用比率总的离差平方总和为13.064;不同基金的组间离差为1.376;组内离差为11.688;它们的方差比分别为0.459和0.325,相除得F统计量的观测值为1.413,对应的概率P值为0.255。这里显著性水平为0.05,由于P值大于显著性水平0.05,所以接受零假设,认为不同类型基金的费用比率没有显著性差异。单因素方差分析表显示了两两基金之间费用比率均值比较结果。表中的星号表示在显著性水平0.05的条件下,相应的两组均值存在显著性差异。表中第四列MeanDifference表示两两不同基金费用比率差值的均值。第五列是进行t检验的概率P值,可以通过比较P值大小来判断两两基金之间的费用比率是否有显著差异。P<0.05,有显著差异;否则无显著差异案例中第二问要比较第三类基金的费用比率和其他基金之间的关系,其实就是要进行均值之间的多项式比较。SPSS分别给出了方差齐性和方差不齐性的检验统计量和概率P值。本案例中不管方差齐性还是不齐性,其概率P值都显著大于0.05,这说明了零假设成立,即混合型股票基金的费用比率是其他三种类型基金费用比率的平均水平。显示了这四类基金费用比率的均值折线图。从图中明显看到,第四类基金的费用比率均值明显高于其他类型的基金。均值折线图多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。例如,对稻谷产量进行分析时,不仅单纯考虑耕地深度和施肥量都会影响产量,但同时深耕和适当的施肥可能使产量成倍增加,这时,耕地深度和施肥量就可能存在交互作用。SPSS在多因素方差分析中的应用软件使用方法多因素方差分析仍然采用F检验,其零假设是H0:各因素不同水平下观测变量的均值无显著差异。SPSS将自动计算F值,并依据F分布表给出相应的概率P值。我们可以根据相伴概率P值和显著性水平α的大小关系来判断各因素的不同水平对观测变量是否产生了显著性影响。Step01:打开主对话框选择菜单栏中的【Analyze(分析)】→【GeneralLinearModel(一般线性模型)】→【Univariate(单变量)】命令,弹出【Univariate(单变量)】对话框,这是多因素方差分析的主操作窗口。Step02:选择分析变量在【Univariate(单变量)】对话框的候选变量列表框中,选择相应变量进行右侧的列表框中,其目的是设置分析变量。●选择观测变量(因变量):添加至【DependentVariable(因变量)】列表框中。●选择因素变量:添加至【FixedVariable(s)(固定因子)】列表框中。●选择随机变量:添加至【RandomVariable(s)(随机因子)】列表框中。●选择协变量:添加至【Covariate(s)(协变量)】列表框中。●选择权重变量:添加至【WLSWeight(WLS权重)】列表框中。Step03:模型选择单击【Model】按钮,弹出【Univariate:Model(单变量:模型)】对话框,该对话框用于选择分析模型。(1)FullFactorial选项系统默认选项。该项选择建立全因素模型,包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应。选择该项后无需进行进一步的操作,即可单击【Continue】按钮返回主对话框。(2)Custom选项建立用户自定义的方差分析模型。点择【Custom(设定)】单选钮后,【Factors&Covariates(因子与协变量)】、【Model(模型)】和【BuildTerm(s)(构建项)】选项被激活。在【Factors&Covariates(因子与协变量)】列表框中自动列出可以作为因素变量的变量名。在【BuildTerm(s)(构建项)】选项组的下拉列表框中,可以选择模型的形式。●Interaction:选中此项可以指定任意的交互效应。●Maineffects:选中此项可以指定主效应。●All2-way:指定所有2维交互效应。●All3-way:指定所有3维交互效应。●All4-way:指定所有4维交互效应。●All5-way:指定所有5维交互效应。●TypeI项:一般适用于平衡的ANOVA模型。●TypeII项:一般适用于平衡的ANOVA模型、主因子效应模型、回归模型和嵌套设计。●TypeIII项:系统默认的平方和分解法。适用于平衡的ANOVA模型和非平衡的ANOVA模型。凡适用TypeI和TypeII的模型均可以用该法。●TypeIV顶:一般适用于TypeI和TypelI方法的模型、有缺失值的平衡或不平衡模型。(3)【Includeinterceptinmodel(在模型中包含截距)】复选框:系统默认选项,通常截距包括在模型中。如果能假设数据通过原点,可以不包括截距,即不选择此项。Step04:选择比较方法单击【Contrasts】按钮,弹出【Univariate:Contrasts(单变量:对比)】对话框。在【Factors(因子)】列表框中显示出所有在主对话框中选中的因素变量。因素变量名后的括号中是当前的比较方法。在该框中选择想要改变比较方法的因子,即鼠标单击选中的因子。这一操作使【ChangeContrast(更改对比)】复选栏中的各项被激活。Step05:选择轮廓图单击【Plot】按钮,弹出【ProfilePlots(轮廓图)】对话框,在该对话框中设置均值轮廓图。从【Factors(因子)】列表框中选择一个因素变量移入【HorlzontalAxis(水平轴)】列表框(水平轴)定义轮廓图的横坐标。选择另一个因素变量移入【SeparateLines(单图)】列表框定义轮廓图的区分线。如果需要的话再从【Factors(因子)】列表框中选择一个因素变量移入【SeparatePlots(多图)】列表框定义轮廓图的区分图以上选择确定以后,单击【Add】按钮加以确定。需要对加入图清单框的选择结果进行修正,可单击【Chang和Remove】按钮。Step06:选择多重比较单击【PostHoc】按钮,弹出【PostHocMultipleComparisonsforObservedMeans(单变量:观测均值的两两比较)】对话框。该对话框用于对均值作PostHoc多重比较检验。从【Factor(s)(因子)】框选择相关变量使被选变量进入【PostHoctestfor(两两比较检验)】框。不难发现,这个对话框与单因素方差分析模型的PostHoc多重比较检验对话框大致相同,各选项意义也一致。Step07:预测值保存单击【Save】按钮,弹出【Save(保存)】对话框。通过在对话框中的选择,可以将所计算的预测值、残差和检测值作为新的变量保存在编辑数据文件中。以便于在其他统计分析中使用这些值。Step8:单击【OK】按钮,结束操作,SPSS软件自动输出结果。实例图文分析:薪金的区别假设某一杂志的记者要考察职业为财务管理、计算机程序员和药剂师的男女雇员其每周的薪金之间是否有显著性差异。从每种职业中分别选取了5名男性和5名女性组成样本,并且记录下来样本中每个人的周薪金(单位:美元)。所得数据见表所示。请你分析职业和性别对薪金有无显著影响。实例操作由于薪金水平的高低和所从事的职业、性别等因素都有关系。因此这里要考虑两个因素水平下的薪金差异问题,即建立双因素的方差分析模型。本案例中,职业和性别是两个影响因素,而每周薪金是因变量。同时,我们也要考虑职业和性别这两个因素之间有无交互作用。具体操作步骤如下。Step01:打开对话框打开数据文件5-3.sav,选择菜单栏中的【Analyze(分析)】→【GeneralLinearModel(一般线性模型)】→【Univariate(单变量)】命令,弹出【Univariate(单变量)】对话框。这里“wage”变量表示每月薪金;“job”变量表示职业的类型;“sex”变量表示性别。提示:在使用前,请注意数据是否符合方差分析的前提条件。Step02:选择观测变量在候选变量列表框中选择“wage”变量作为因变量,将其添加至【DependentVariable(因变量)】列表框中。Step03:选择因素变量选择“job”和“sex”变量作为因素变量,将它们添加至【FixedFactor(s)(固定因子)】列表框中。Step04:选择多重比较单击【PostHoc(两两比较)】对话框。在【Factors(因子)】列表框中选择“job”变量至【PostHocTestfor(两两比较检验)】列表框,并且勾选【LSD】选项。这里表示要进行职业变量的两两多重比较。再单击【Continue】按钮,返回主对话框。Step05:其他选项选择单击【Options】按钮,弹出【Options(选项)】对话框。勾选【Descriptive(描述性统计量)】复选框表示输出描述性统计量;勾选【Homogeneity-of-variance(方差同质性检验)】复选框表示输出方差齐性检验表。再单击【Continue】按钮,返回主对话框。提示:根据数据特点及您的实验要求,选择不同的均值多重比较方法。Step06:完成操作最后,单击【OK(确定)】按钮,操作完成。薪金区别.sav实例结果及分析(1)描述性统计分析表左边两表是对样本数据的基本描述结果。上面的表列出了各种水平下的样本个数。下面的表列出了不同职业、性别每周薪金的样本均值和标准差。从数值大小比较看,不少职业和性别之间每周薪金差异较大,说明有进一步采用方差分析的必要。(2)方差齐性检验SPSS的结果报告接着列出了方差齐性检验结果。由于这里采用的是Levene检验法,故表格首先显示Levene统计量等于0.383。由于概率P值0.856明显大于显著性水平,故认为样本数据的方差是相同的,满足方差分析的前提条件。(3)双因素方差分析检验表在表中,第一行的CorrectedModel是对所用方差分析模型的检验,其原假设为模型中所有的影响因素均无作用,即职业、性别及两者的交互作用等对每周薪金都无显著影响。该检验的P值远小于0.05,因此所用模型有统计学意义,以上所提到的因素中至少有一个是有显著差异的,但具体是哪些则需要阅读后面的分析结果。第二行是对模型中常数项是否等于0进行的检验,虽然根据概率P值判断它显著不等于零,但它在分析中没有实际意义,忽略即可。第三、四行分别是对职业、性别的影响效应进行的检验,其零假设分别是:职业或性别对薪金没有显著性差异。但这两行对应的相伴概率P都接近0,显然小于显著性水平0.05。可见,两者分别对薪金有显著性影响。第五行是对职业和性别的交叉作用进行检验,可见P为0.011,小于显著性水平,表示交互作用对观测变量每周薪金有显著性影响作用。从上面方差分析结果看到,职业、性别及其两者的交互项都直接影响了每周薪金的高低,存在统计学意义下的显著差异。(4)多重比较检验结果表显示了不同职业之间每周薪金均值比较结果。表中的星号表示在显著性水平0.05的条件下,相应的两组均值存在显著性差异。可以通过比较表中概率P值大小来判断职业之间的薪金水平是否有显著差异。从结果来看,药剂师和其他两个职业的每周薪金存在显著性差异。该职业的平均薪金要明显高于财务管理和计算机程序员职业。
/
本文档为【spss基本操作】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索