EFA在教育、心理领域存在的问题及建议-MTV学习库

1. 样本量和观察变量数量不足。在许多应用探索性因子分析的研究中，一个常见的问题是样本量和观察变量的数量太小。在探索性因子分析中，样本量一般要求至少为100-200。当变量的共同方差较大时，一定数量的小样本也能保证因子载荷的稳定性。国内学者曾做过一项调查，结果显示：1991年至2000年国内两本心理学期刊发表的采用因子分析的文章中，近10%的文章研究的样本少于100个，甚至多达50%文章未提供此信息。至于观测变量的数量，一般认为观测变量与提取因子数量的比值至少为4。许多研究者认为观测变量的数量与提取因子的数量无关，因为研究者事先不知道会提取多少因子。因此，不能根据提取的因子数量来确定观察变量的数量。然而，事实上，许多研究者在进行因子分析之前，对所考虑的观测变量的因子结构抱有一定的期望。在教育和心理学领域，有相当多的研究不符合这些标准。这可能是因为研究者对因子分析的要旨没有深入的理解，但更可能的是研究者对这类方法的细节没有给予足够的重视。

2、因子提取方法的误用探索性因子分析中常用的因子提取方法主要有两种：主成分分析法和主轴因子法。在决定采用哪种方法时，一般有两点值得考虑：一是因子分析的目的；二是因子分析的目的。第二，对变量方差的理解程度。如果因子分析的目的是用最少的因子最大程度地解释原始数据的方差，则采用主成分分析法；如果因子分析的主要目的是确定数据结构，则主轴因子法是合适的。

事实上，尽管大多数研究者认为主成分分析法和主轴因子法的结果相差不大，但他们提出主轴因子法使用复相关系数的平方作为共同的初始估计值。方差，通过不断重复，最终得到一个确定的共同方差的值，因此这个过程得到的因子载荷比主成分分析更准确。因此，他建议研究人员应该使用主轴因子法而不是主成分分析法。然而，在实际研究中，研究者大量使用主成分分析方法。造成这个结果最直接的原因可能是SPSS软件默认设置的是主成分分析法。

3、因子个数的确定标准及因子轮换中存在的问题在心理学领域，研究者确定因子个数的标准大多为法，即特征值≥1.0的标准。在SPSS中，默认的因子提取方法是主成分分析方法，但实际上这个标准只适用于主成分分析方法。提出特征值≥1.0的标准通常会导致提取的因子过多。当提取的因素太多时，这些因素的重要性就变得值得怀疑。例如，假设有一种情况，分别从 5 个变量和 10 个变量中提取因子。在5个变量的情况下，特征值为1.0的因子将解释变量总方差的20%（1/5，每个变量的方差估计为1，总方差为5）；因此，在10个变量的情况下，相同特征值1.0的因子只能解释总体方差的10%（1/10）。显然，当从大量变量中提取因子时，使用这样的标准将导致提取的因子只能解释总方差的一小部分。筛板检验标准过于主观，并且在某些情况下，因子的特征值不存在临界点，因为因子的特征值以线性方式逐渐减小，因此这种情况是可能的。，如双负载现象，因此，该方法不具有很强的使用价值。一般推荐使用Reise等人的并行分析方法。来确定因素的数量。与碎石测试标准相比，该标准减少了研究者主观因素的影响，结果更加客观、真实、有效。

虽然正交旋转可以很容易地解释和表示因子分析的结果，但正交旋转的结果往往不切实际，因为它规定因子不相关。在探索性因子分析中推荐使用倾斜旋转法，这样不仅可以方便地解释因子，而且可以保证因子之间的结构简单。更重要的是，它允许因素之间存在相关性，并且更加现实。例如，在探索性因素分析中提取了家庭教育水平和家庭经济收入两个因素。如果勉强进行正交旋转，而忽略了两个因素之间的相关性，势必会对结果产生很大的影响。事实上，这两个因素都属于家庭社会经济地位的范畴，并且具有较高的相关性。因此，进行倾斜旋转，让两个因素之间存在相关性，这样得到的结果会更有说服力。在实际研究中，研究者仍然多采用正交旋转方法。国内两本心理学期刊1991年至2000年发表的使用因子分析的文章中，使用正交旋转的文章高达60%，而倾斜旋转仅占6%。

4.因子值缺乏重复验证。在心理学和教育领域，研究者在求解因子值时，大多依赖SPSS，通过该软件提供的求解因子值的方法最终通过某种方式获得因子值。以加权方式获得，这使得这些因子值仅适用于特定样本，缺乏重复性。

为了克服这一缺点，研究人员建议使用一种简单的未加权方法，该方法首先识别某个因素上具有较高载荷的变量，然后将这些载荷的值相加以获得反映该因素的值。因子的特定因子值。使用这种方法，研究人员将丢失变量对因子的加载信息。但这样得到的因子值与SPSS提供的各种权重的因子值有很高的相关性。因此，使用这种简单的策略得到的因子值是非常有意义的，它可以克服缺乏重复验证的缺点。

当然，因子值本身本质上是一个观测变量，存在一定的随机误差。这些随机误差可以使用潜变量模型方法来消除。

5、研究成果呈现形式不规范。在因子分析结果的呈现中，对于研究者需要明确提供哪些信息有一定的规定。然而，在教育和心理学领域的应用中，很少有研究人员能够提供完整的信息。相关矩阵作为因子分析的基础，是最基本的，必须由研究者提供。否则，研究结果将缺乏重复验证的可能；此外，还必须提供旋转前后因子解释的方差、因子载荷矩阵等信息。

6.过于依赖SPSS，缺乏主动性

近年来因子分析应用中最大的问题是研究者过于依赖SPSS软件。计算机常常控制人脑，研究人员失去主动性。前面讨论的因子分析实际应用中的一些主要问题，很大一部分是SPSS本身造成的。研究者在进行因子分析时，大多脱离了自己的研究实际，盲目采用SPSS的各种默认设置。最终获得的研究结果缺乏可信度，不符合实际研究的需要。例如，在对连续或非连续（如二元分类）变量进行因子分析时，研究者应选择适当的分析方法，不能忽视观察变量的类型而进行统一处理。对于连续变量和非连续变量组成的混合变量，研究人员推荐使用Tobit模型；对于分类序数变量，应使用最大似然法 ( ) 或加权最小二乘法 ( Least )。为了克服这种依赖性，一些研究人员提出使用其他统计方法，迫使研究人员在进行统计分析时需要更多思考，例如CEFA软件。

总之，在实际研究中，研究者应根据各种情况选择合适的统计策略，尽量克服各种可能出现的问题，避免人脑被计算机控制；此外，研究者本身也应加强因子分析统计知识的学习。正确使用它也至关重要。

给这篇文章的作者打赏

相关文章

获取css中的选择器用法实例讲解使用了一套

“看电视”专访北京体育大学新闻与传播学院院长李岭涛

手机充电有绝招，按下这个键，充电就能快一倍！