您的位置  > 互联网

(实操)班级数学语文成绩.sav数据反映不同班级的学生性别

在SPSS中,探索性分析是对变量进行深入而详细的描述性统计分析。 它在一般描述性统计指标的基础上,增加了对数据其他特征的文字和图形描述。 分析结果更加详细、全面,有助于对数据进行进一步的分析。

探索性分析可以生成有关所有案例或不同案例分组的全面统计数据和图表; 可以进行数据筛选,如检测异常值、极值、数据缺口等; 它还可以执行假设检验。 通过探索性分析,可以帮助我们决定选择哪种统计方法进行数据建模,确定数据是否需要转换成正态分布,是否需要做非参数统计。

探索性分析适合分析数值变量(连续型或比率型),因子变量应该是具有有限数量离散值的分类变量(用于对数据进行分组)。

实际操作

下面我们看一下具体的例子。 案例:“班级数学和语文成绩.sav”,数据反映了不同班级学生的性别、数学、语文成绩。

Step1:点击菜单“分析-描述性统计-探索”,进行探索性分析过程。 主设置界面如图1.1所示。 在因变量列表中选择数学,在因子变量列表中选择性别,在标签案例中选择类别。

图1.1

因变量列表,用于从变量列表中选择因变量,通常是连续变量。

因子列表用于从变量列表中选择因子变量,通常是分类变量。

如果同时选择多个因变量和多个因子变量,则分别分析它们之间的两两组合。 对于每对因变量和因子变量,输出结果将相似; 选定的变量 通常,它可能需要很长时间并产生大量输出。

标签案例用于从变量列表中选择标签变量并识别结果中的观察结果。

Step2:点击“统计”按钮,弹出统计设置对话框,根据需要选择统计,如图1.2所示。

图1.2

描述性复选框,选中此项将输出一个包含以下内容的表格:均值、中位数、众数、5%校正均值、标准误差、方差、标准差、最小值、最大值、极差、峰度系数、峰度系数标准误差、偏度系数、偏度系数的标准误差等。

M- 复选框,计算并输出比平均值和中位数更稳定的数据中心估计值,包括以下四种:“Huber's”、“”、“'s”和“Tukey's”。 M估计可用于确定数据中是否存在明显的异常值。 如果 M 估计值远离平均值和中位数,则可能存在异常值。

异常值复选框,输出 5 个最大值和 5 个最小值,包括观察值的标签。

百分位数复选框,输出 5%、10%、25%、50%、75%、90% 和 95% 的百分位数。

第三步:点击“绘图”按钮,弹出绘图设置对话框。 根据需要进行绘图设置,如图1.3所示。

图1.3

箱线图,设置箱线图的参数。

按因素级别选项分组。 对于每个因子变量,每个图表中仅显示一个因变量。 该选项是默认选项。

如果没有分组选项,每个图都会显示每个因子变量的所有因变量。

如果没有选项,则不会绘制箱线图。

描述性,设置有关数据描述性的图形输出,有两个选项:茎叶图和直方图,茎叶图为默认设置。

带检验的正态图,制作正态概率图和去趋势后的正态概率图,并输出统计量和置信度来检验正态性。

拉伸和水平检查、设置控制分布与水平图的数据转换。 还显示回归曲线的斜率和方差齐性检验的统计数据; 如果选择数据转换,则会测试转换后的数据。

如果没有选项,则不会输出步行与水平图。

功效估计选项生成四分位数的自然对数、单元格中位数的自然对数以及满足方差齐性要求的功效估计的散点图; 基于此散点与水平图,可以估计每组将方差转换为同方差所需的功效。

转换选项,在下拉列表中选择具体的变换方式,默认为自然对数变换。

未转换选项不进行任何数据转换,将输出原始数据散点图,相当于进行1次幂转换。

第四步:点击“选项”按钮,弹出选项设置对话框。 根据需要设置缺失值的处理方式,如图1.4所示。

图1.4

按列表排除案例的选项是默认选项。 对于每条观测记录,只要分析中使用的变量之一包含缺失值,该观测记录就会从所有分析中删除。

通过按“排除个案”选项,只有当分析中使用的变量包含缺失值时,才会从当前分析中排除相应的观测记录。 这种方法可以最大限度地利用原始数据。

报告值选项将因子变量中存在缺失值的观测值作为单独的类别进行计数,所有输出结果将包括标识为缺失的此类别。

结果分析

返回主界面,点击确定即可得到探索分析的分析结果,如图1.5-1.13所示。

图1.5

图1.6

图1.7

图1.8

图1.9

图1.10

图1.11

图1.12

图1.13

1、案例处理汇总及说明表输出,如图1.5-1.6所示。

汇总表给出了不同性别的有效数和缺失数。 本例中没有缺失数据; 描述表给出了不同性别的描述性统计输出,包括均值及其95%置信区间、中位数、方差等,其他年龄段的输出类似。

2. 正态性检验结果,如图1.7所示。

正态性检验的显着性水平sig值均大于0.05,因此认为不同性别的数学成绩分布基本呈正态。

3、方差齐性检验结果,如图1.8所示。

四个检验的sig值均大于0.5,因此不能拒绝方差齐性的假设。

4、直方图和QQ图输出,选择性别为女性的输出图表,如图1.9-1.11所示。

从频率直方图来看,女生数学成绩大部分在70、80左右; 从剔除趋势的QQ图来看,除了两个偏差较大的失败点外,其余都分布在横轴附近。

5、箱线图及分布图和水平图,如图1.12-1.13所示。

在数学成绩与性别的箱线图中,女学生的数学成绩存在异常值(较小)。 在数学按性别的分布及水平图中,女生的数学成绩大多分布在79分左右,而男生的数学成绩大多分布在81分左右。

回复私信“”即可获取操作数据。