第二节 教育研究资料的定量分析
一、定量分析的概念★★★
定量分析是指研究者借助于数学手段,对所搜集到的数据资料进行统计分析,揭示事物数量特征的过程。定量分析的主要手段是统计方法,即运用统计学的原理和方法,研究如何搜集、整理和分析教育调查和实验得到的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。
二、定量分析的方法★★★★★(2011年统考已考选择题)
(一)数据描述(2015年统考已考选择题、2016年统考已考选择题)
在教育研究中,我们通常采用各种统计指标来描述数据的特征,据此说明现象的有关性质。常用的统计指标有集中量数、差异量数、地位量数、相关系数等。
1.集中量数(2018年厦大已考名词解释)
数据的集中趋势就是指数据分布中大量数据向某方向集中的程度。代表集中趋势的量数指标叫作集中量数。常用的集中量数有算术平均数、几何平均数、中数、众数。
2.差异量数
表示一组数据相互间差异程度或离散程度的量数称作差异量数,它反映数据分布的离中趋势。差异量数越大,表示数据分布范围越广,数据就越松散。常用的差异量数有全距、平均差、标准差和方差。其中最常用的是标准差和方差。
3.地位量数(2014年统考已考选择题)
在一个次数分布中,每一个数据都有相应的地位,都可用一定的地位量数来说明它所处的位置。凡是能够反映次数分布中各数据所处地位的量数,就称为地位量数。常用的两种地位量数为百分等级和标准分数。
4.相关系数的含义及种类(2018年统考已考单选题)
在教育研究中,常需分析变量与变量之间的关系,如学生智力与学习成绩的关系、教学经费与教学效果之间的关系、两科成绩或多科成绩之间的关系等等。统计中,主要用相关及相关系数解决变量之间的联系问题。所谓相关,通常指两列变量之间的相互关系。一般有三种性质的相关:
(1)正相关,两个变量的变化方向一致,即一个变量值变大(小)时,另一个变量值在总的趋势上往往也随之变大(小)。如智力高低与学业成绩优劣之间的关系。
(2)负相关,两个变量的变化方向相反,即一个变量值变大(小)时,另一个变量值在总趋势上则往往随之变小(大)。如旷课时数与学习成绩、身体健康状况与发病率之间的关系。
(3)零相关,又称无相关,即两列变量之间的变化没有一定的规律,一个变量变化,另一个变量不显示出变化倾向。如学生的身高与学习成绩、相貌与思想品德之间的关系等。
相关系数是表示两列变量间相互联系程度与方向的数量指标,通常以r表示,其取值范围为-1.00~1.00。根据数量资料的性质,相关系数有多种计算方法。教育研究中最常用的有积差相关、等级相关与点二列相关等。
(二)数据推断
数据推断即根据样本的资料和数据推断全体的情况。它是在描述统计的基础上进行的,从研究对象的全体中,抽取一部分为样本进行研究,以样本研究的结果,来推断全体的情形,从而找出研究对象的基本规律。
1.参数估计
参数估计是用样本指标量(计量)估计总体指标量(参数)的一种数据推断方法。由于样本并不能完全代表总体,会不可避免地出现随机误差或取样误差,而在统计推断中又需要根据样本资料对总体参数做概括说明,故这种估计或推论过程也就不可能是完全精确的。所以,统计推断只能在一定的概率保证基础上进行。参数估计分为以下两种:
一是点估计,这是在不知道总体参数时,用一个特定的值(统计量),如样本的平均数、样本的方差等作为总体的参数估计。使用这种方法时估计量必须具备无偏性、一致性、有效性和充分性等条件。
二是区间估计,就是用数轴上的一段距离或一个数据区间,表示总体参数的可能范围,这一段距离或数据区间称作区间估计的置信区间。区间估计一般包括总体平均数的区间估计、总体百分数的区间估计、总体标准差的区间估计和总体方差的区间估计以及总体相关系数的区间估计等。
2.统计检验
当需要判断两个样本的统计值之间的差异是来自相同的总体(随机误差、抽样误差),还是来自不同的总体(系统误差、实质差异)时,即差异是否存在于两个总体之间时,需要对样品的差异显著性进行检验,这种检验就叫作统计检验,又称假设检验或差异显著检验。在教育研究中,常用的统计检验有两种:Z检验和t检验。
(1)Z检验,是用正态分布的理论来推论差异发生的概率,从而推论两个平均数的差异是否显著。Z检验适合于大样本资料(n>30)。
(2)t检验,是利用t分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。t分布是抽样分布的一种,是小样本的抽样分布。t检验是适合于小样本(n<30)资料的差异显著检验的方法。
注意:定量分析的几个数据描述指标往往是考查的重点,2009年出了简答题,2010年又以选择题的形式考查,因此考生一定要掌握,并注意区分这几个指标的差别及应用条件,根据题目所出情况判断应该使用哪个指标。
◆易出题型:选择题