传播学百科网 >>所属分类 >> 调查法   

定序变量

标签: 变量 Gamma系数 dy系数 斯皮尔曼等级相关系数

顶[0] 发表评论(0) 编辑词条
目录

定义编辑本段回目录

       变量的一种,区别同一类别个案中等级次序的变量。定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有>与<的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(=,≠)。例如文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。但是,各个定序变量的值之间没有确切的间隔距离。比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。定序变量在各个案上所取的变量值只具有大于或小于的性质,只能排列出它们的顺序,而不能反映出大于或小于的数量或距离。

简介编辑本段回目录

       对于两个定序变量关系强度的测量,可以选择Gamma系数、萨默斯的dy,系数和斯皮尔曼等级相关系数。Gamma系数、dy系数和斯皮尔曼等级相关系数的平方值都有削减误差比例的意义。

Gamma系数

       Gamma系数可以用G来表示,用于分析两个定序变量之间的对称关系,即无自变量与因变量之分。由于存在顺序排列问题,G的取值在-1~1,代表了相关的强度和方向。

G系数的计算公式
11


      

     

        所谓同序对是指某对个案在两个变量上的相对等级相同,如果不相同,则称为异序对。下面举例说明N和N的计算方法。假设,某杂志社进行随机抽样调查收集了100名读者的相关信息,其中文化程度与收入等级的信息如表所示,根据数据资料计算G系数。

22


      

        

      表中计算同序对数量等于表内每个频数乘以其右下方全部频数之和,然后加总,而异序对数量则等于表内每个频数乘以其左下方全部频数之和,然后加总。
       因此,
       Ns=12 (30+5+16+12)+10(5+12)+8(16+12)+30(12)=1510
       Nd=3(30+8+16+4)+10(8+4)+5(4+16)+30(4)=514

33


      

      

说明用文化程度去预测收入等级,可以削减49%的误差。

dy系数

       与Gamma系数测量对称关系不同,d系数用于测量非对称关系。取值范围也在-1~1。d系数的计算公式如下:

44

       同序对数和异序对数的计算方法与G系数一样,T等于列联表中的每个频数乘以他右面的所有同行频数之和。以表为例,

       所以

55


     

     

       表明以文化文化程度高低来预测收入等级,可以削减34%的误差。
       需要特别指出的是,从严格意义上讲,对于表中的数据我们可以大致推断出两个变量之间存在非对称关系,所以d系数的计算更为恰当。之所以采用了用一组数据计算Gamma系数,目的是为了更便于读者理解两个公式的差异。做法虽然不够严谨,但大致上还可以接受,因为变量的测量层次是首要选择的标准,其次才是关系是否对称。

斯皮尔曼等级相关系数

       斯皮尔曼等级相关系数可以用p表示,属于对称相关测量法。它是以变量没有相同等级为前提的,但如果相同等级不太多的话,可以采用平均等级的方法进行计算。公式为:

66


      

      

      

       其中D表示每个个案在两个变量上的等级差异,n表示全部个案数目。
       P的取值范围在-1~+1,其平方值具有削减误差比例的意义。
       斯皮尔曼等级相关系数使用范围较广,尤其是当某些定居变量在计算相关系数而又不能满足特定要求时,往往可以选择降低变量层次,作为定序变量来处理,计算斯皮尔曼等级相关系数。

附件列表


您所在的用户组无法下载或查看附件

→如果您认为本词条还有待完善,请 编辑词条

上一篇我说中国 下一篇普查

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

收藏到:  

词条信息

刘旭颖2130
刘旭颖2130
书童
词条创建者 发短消息   
金玥2131
金玥2131
书童
最近编辑者 发短消息   

相关词条