HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

统计学变量类型集锦9篇

时间:2023-08-06 10:52:31

统计学变量类型

统计学变量类型范文1

匈牙利数学家玻利亚说:“类比是一个伟大的引路人。”类比作为一种思维方法,其侧重的不是逻辑性、确定性、严格性,而是创造性、猜测性、灵活性。概率统计中的许多概念都可以通过类比引出并揭示其本质。此外,我们可利用原有的认知结构借助类比法,有效地掌握新知识,并将这些知识有机系统地统一起来。

1.1随机事件的关系运算与集合的关系运算的类比由于事件可以看成由某些样本点构成的集合,因此可将二者类比学习。例如:集合A∪B表示其中任意一个元素x仅属于A或者仅属于B或者属于A和B的公共部分,我们可以形象地用韦氏图来表示。此时若将A和B看作是事件,则事件A∪B表示“事件A和事件B至少有一个发生”,记作A+B,即概率论中事件的和等同于集合论中集合的并集。同样的类比方法,我们可将集合论中集合的交集类比到概率论中事件的积中去。在教学中可引导学生先回顾集合之间的各种关系运算,随之再引出相应的事件间的关系运算,最后归纳总结。此外,事件运算的性质如交换律、结合律、分配律均可对照集合的相应性质进行类比学习。

1.2离散型随机变量与连续型随机变量的类比对于离散型随机变量,学生感觉较容易,但对于连续型随机变量,往往学生感觉抽象难理解。由于分布列在离散型随机变量中的地位与密度函数在连续型随机变量中的地位等同,因此对于离散型随机变量中的边缘分布列与联合分布列的关系可以过渡到连续型随机变量中边缘密度函数与联合密度函数的关系中去,此外诸如随机变量的独立性的充要条件以及期望与方差的计算均可轻松过渡。具体我们可通过“把连续的问题离散化”这种方法,实际是将对离散型随机变量中对分布列的求和变成对连续型随机变量中的密度函数求积分即可。表1我们将对其中的部分性质及计算作一个简要的类比。

1.3一维随机变量与二维随机变量的降维类比任何学习都是循序渐进的,一般来说低维空间的知识相对简单,容易被学生接受,所以最好的方法是从低维空间向高维空间过渡学习。降维类比法是将高维空间中的数学对象降低到低维空间中去观察,利用低维空间中数学对象的性质类比归纳出高维数学对象的性质。我们知道一维离散型和连续型随机变量的分布函数分别为:在研究二维离散型和连续型随机变量时,我们可用降维类比法得到其联合分布函数分别为:通过上面的类比得知抽象的二维随机变量的分布函数与一维随机变量有着一致的表达式,从而大大降低了学习的难度。此外,二维离散型随机变量的联合分布列与连续型随机变量的密度函数的性质与计算均可借助一维随机变量的相关知识引入。

2类比法在习题教学中的应用

类比法是解题的有力工具。在习题教学中,教师若常引导学生用类比思维去寻找解题的方法,会起到事半功倍的效果。我们首先可以利用条件、结论或者结构形式上的类似,联想与之类似的概念性质从中得到启发。例如,在概率统计中有这样一题:已知连续型随机变量X的概率密度函数为f∪x∪=ae-3xx>00x≤≤0,求a。分析:此题若由密度函数的性质,通过积分可求得a=3。但是我们若通过与指数分布的密度函数f≤x∪=λe-λxx>00x≤≤0进行对比,可知a=3。这样在解题中不需要计算便可得到结果。

3、总结

统计学变量类型范文2

【关键词】中国传统服装学 原数法 直接设计 原数

【Abstract】Chinese traditional clothing theory is an important part of the world, especially in the field of clothing design and cutting. This paper provides a V scheme, the invention of the armhole depth oblique formula: AH/2-k*E=V, with the V line to automatically determine the armhole depth.Breaks the situation which can not calculate the garment armhole depth, width, curvature and perimeter factors by existing technology.Solves a problem in the world clothing studies, and proves the importance of Chinese traditional clothing theory in the world.

【Key words】Chinese traditional clothing theory; Original number method; Direct design; The original number

中国传统服装学在世界服装学中的重要性有多重?有关学术界并没有作过透彻分析和正确论证,甚至不知道中国传统服装学的基础理论是什么。本文从世界服装学的服装设计裁剪法分类入题,分析了目前常见裁剪法的不足和问题所在。通过对中国现有服装裁剪技术方法的创新,弥补了这一世界性难题。

1 世界服装学仅有两类服装设计裁剪法

世界服装学中,所谓国际领先的服装设计裁剪法非常多,仅日本原型法就有三种以上。而根据服装裁片的画线裁剪步骤和最基本的设计理念推出,世界服装学仅有两类服装设计裁剪法:一类是中国传统服装学的直接设计裁剪法,通过计算,将服装规格值展示的数量概念等量转移为形态概念直接设计服装裁片,基础理论是“以数成型”,以目标号型要素内在量为核心。另一类是日本与欧美等国的原型法、中国首部服装高等职业教育教材基型法等现代服装学的变量转移的间接设计裁剪法,以依靠非目标物体对比才能构成目标物体形态概念的原始社会理论为基础,以非目标物体与外界的差为核心。

2 变量转移的间接设计裁剪法

服装学,袖窿代号为AH,胸围为B。AH主要由深度、弯度、周长等三要素构成,人体运动因素和心理因素需要的服装放松量与款式变化量导致AH宽窄大小不等,三要素形态结构多变,如何“依据袖窿周长规格统一计算确定AH三要素”成为服装学的一项世界性疑难问题。为此,各国《服装号型标准》不设袖窿周长规格;各种服装教科书敢于围绕AH设计理念命名,却不敢设立验证所设计的AH线长对与错的服装学术准则。为便于直观解说,本文设服装放松量与款式变化量为cc,各国《服装号型标准》设定的服装成品规格数值已含cc。例如,现代服装学最具代表性的原型法,重在经验论、板型论和艺术性,分两遍间接设计cc:第一遍,面对《服装号型标准》设定的“三开片”(西装类)服装款式的成品规格数值,也要变量转移出只含部分放松量c、微大于人体形态测量基数、小于服装成品规格原数的数值计算,设计裁剪无款式名的、接近人体原型的 “四开片”(衬衫类)原型纸板;第二遍,对比原型纸板,求证出与目标号型成品规格的误差量为另部分C;外加另部分C楹诵模才知道本款衣片板型不要大弯度AH,必须对比原型AH缩弯度、加长度、移动纵向深度,纵向移动量要大于横向C;对比1个板型很好的原型板,能凭经验间接设计裁剪多种有款式名的成型衣片、AH(如图1)。而这类以经验值为固定尾数的袖窿公式繁多,用哪道公式计算AH深度才能画裁出板型很好的原型板?衣片AH线该画成多少长?是对还是错?这些最基本的技术理论问题无法解答,严重缺乏科学性。

3 等量转移的直接设计裁剪法

3.1 传统规则

直接设计裁剪法重在数与形的实质关系,讲究一遍净,不分割求证C。但一件单衣画两遍、裁两遍,尽是学徒作。不规范,不可赞也。通过计算,将服装成品规格值展示的数量概念等量转移为形态概念直接设计服装裁片,其裁片就能制造目标号型服装成品。否则,所设计裁剪的只是目标号型以外的非目标物体、非目标裁片,不能制造目标号型服装成品。但该方法没能解决所属世界性疑难问题,只有依据袖窿周长规格凭经验确定袖窿深。因为,服装在袖窿部位的款式、板型、号型的变化设计,区别于袖窿周长、宽度、弯度、深度等要素形态。而历代服装大师流传的袖窿深度垂直计算公式,对于袖窿周长、宽度、弯度、深度等形态要素实质的统一计算功能,几乎呈瘫痪状态。

3.2 新创原数法

3.2.1 发明AH深度斜向计算公式

本文所述新创原数法的V方案,由一条V线自动确定AH纵向深度,技术特征包括以下步骤:(1)通过公式AH/2计算,将AH规格原数值压缩进V线。(2)将AH款式变化量规范为AH宽度变化量,代号K;以B/2为基准、据款式要求画出肩点等相关要素,依据前后肩点平画AH宽度线:前K、后K。(3)创造一个AH弯度系数斜向折变率“E”,将AH不同深度差转化为AH弯度系数kE,确定前k*E=kE。实验发现“E”在多位小数间波动,为便于统一计算,舍取确定:E=0.45。(4)发明AH深度斜向计算公式:AH/2-k*E=AH/2-kE=V。例如 :图2是设计一件单西装:确定AH周长规格为60CM、画得前k =6CM。设AH深度斜向计算公式 :60/2-6*0.45=30-2.7=27.3.,答:本款V线长等于27.3CM。

3.2.2 自动确定AH深度

(1)设胸宽线上端、前后肩高低差1/2高度处为V线上端固定点,V线下端向下顺侧缝线滑动,与侧缝线相交,由此斜向自动确定AH纵向深度点。(2)依据AH深度点画胸围线。设前K、后K至胸围线的垂直面为AH形态面积;设胸宽线下1/3高度处为AH外侧点。(3)AH三要素纵横双向形态结构比与数量分布式,已由V线下端识别、确定并一步锁进形态面积;基于形态面积、各由肩点至外侧点至AH深度点直接画有款式名的衣片AH即可。(4)验证微调:以AH总长=袖窿周长规格原数为基准:如果,由于“E”值的舍取、胸肩差大小不等(胸宽线至前肩点的间隔差)、画线手法不同等原因造成AH总长(前AH+后AH)误差,可实行等量转移微调,不变形的、相应的上下移动外侧点以下的AH线和胸围线,移动量=误差量/2。(5)建立世界服装学能平等统一正确论证的服装学术准则:所设计的各部位要素值与预定规格原数值相等为对,不相等为错。

因为,V线能依据K量变化自动改变自身斜度,而K量的变化来自于服装原数内的服装放松量与款式变化量。所以,V线具有提取目标型号服装款式变化信息、自动识别衣片板型属性、识别该款AH需要大弯度还是小弯度等科学功能。实用记录证明:V线自动识别确定各种款式板型号型的AH弯度、深度的精准度达100%,设计者不必求证AH纵向深度值,不受经验论、板型论制约,却能直接、快速实现目标号型衣片AH的形态艺术性。

4 结语

新创原数法继承并科学的创新了直接设计裁剪法,更精准简快的解决了服装学在袖窿部位的世界性疑难问题,证明了中国传统服装学在世界服装学中的重要性,对中国传统服装学全面走向现代高科技领域起到了一种推动作用。

参考文献:

[1]五善珏.欧美男装打版技法大全.上海文化出版社[M].2005.

统计学变量类型范文3

(一)计量经济模型的设计

(设模)计量经济模型是以变量来表述我们的研究对象及其影响因素的观察结果,以方程式或方程组表述这些研究对象及其影响因素之间的关系,而其最基础的内容主要反映在单方程模型中,它一般是由如下四个基本要素构成的:

1.变量反映我们研究对象及其影响因素的观察数据,构成了模型的变量要素,它基本上可以分为两大类,即解释变量和被解释变量。其中:解释变量(ExplanatoryVariable)代表着系统中影响研究核心的各种因素,一般情况下只观察一个因素影响的回归分析叫做一元回归分析,而对两个及以上的因素分析叫做多元回归分析。在分析中要观察解释变量的不同控制下,相应的被解释变量的反映,所以说解释变量是确定性的变量。但在经济现象观察中,我们很难对各解释变量进行控制,这也是我们在现实中遇到的一大难题。被解释变量(ExplainedVariable)是我们研究的核心内容。我们的研究依赖于对其观察所得到的现实数据,但是其被动的地位是确定的,即它是系统中的被影响结果。且因受随机性的各种干扰而表现出随机性的特点,因此我们寻求的总体回归方程将是一种平均意义上的期望方程。

2.回归方程及其形式反映研究对象各变量关系的方程是模型的主体部分,它就是由统计回归分析的方法得到的回归方程。在现实的人类社会中,事物的普遍联系性,常常隐含着未知的因果关系。任何一个系统,在影响系统的各因素作用下,都能保持一种稳定的状态,而对这一稳定状态的形成机制的寻找过程,已成为现代回归分析的核心内容。因此,在回归分析中,人们常将系统的稳定关系,以方程式的形式来表示。且以研究对象为被解释变量,以各影响因素为解释变量,建立起解释变量决定被解释变量的回归方程。以方程中的参数来反映现象之间的因果关系,并进一步寻求对系统的控制和影响的方法。在计量经济学中,线性关系的回归方程是最常见的,因为它是基础,且简单容易理解,所以是我们首先要学习的内容。然而现实中经济现象的复杂性,却常表现为非线性的特点,要准确描绘这些复杂形式,需要我们研究和开发更多视角的分析方法,如解释变量的一元与多元,被解释变量的线性与非线性、确定与随机、二元选择与多元选择等。这些变量之间的组合方式,就构成了方程的形式,需要我们不断的调算或检验才能确定。

3.经济参数经济参数是在各类模型中变量之间的关系系数,它反映着我们要探求的经济规律,是我们必须求解才能得到的内容,如模型中各回归系数等。该要素实质上是计量经济分析的最终成果,但它关系到我们经济分析的恰当有效性。

4.模型的误差项计量经济模型所探究的是如何使用回归方程,来反映解释变量与被解释变量之间的内在联系。然而随机因素的干扰,会使系统产生一定的偏离,这种偏离被我们称之为模型的误差。误差的大小及稳定程度,表明随机性干扰对系统的影响程度及持续的作用程度。由上述四大要素构成的,能真实反映总体经济关系的理想模型,被我们称之为总体经济模型,它往往是未知的,是需要我们去探究和寻找的模型。而在探索过程中,我们要通过经济理论或经验来设定总体模型的可能形式,再用样本数据来实证我们设定的模型是否正确。可见模型的设定是我们建立模型的基础和灵魂,是计量经济分析的关键环节。

(二)模型参数的估计

(算模)由方程式或方程组构成的各类经济模型,本身只能表明现象之间是否有联系,而方程中各类参数才是真正说明现象之间具体关系的内容。所以说各参数是反映经济规律的主体,更是我们建模所追求的目标。而利用样本观察到的各类数据有着很多随机因素的作用,使得本来并不明确的数量关系都变得更加模糊了,因此我们需要一系列的统计方法,将这种隐含的关系查找到,并能够做到尽可能的准确,这就是模型参数的估计问题,而解决的方法有很多,如最小二乘法、极大似然估计法、距估计法等。

(三)模型的检验

(验模)我们设计和估算的模型是否科学合理,以及如何改进模型使其达到更加科学合理,需要我们做大量的检验和监测工作。所以对模型进行各类检验的学习,将占据计量经济课程的绝大多数时间,并成为了我们学习的主体内容。具体的检验内容包含如下四部分:

1.统计显著性检验当我们根据样本数据对模型的参数进行估算时,该样本的特征是否能够代表总体特征的检验就是统计显著性检验。由于模型参数的估算是根据样本数据进行的,那么某个参数是否显著,以及参数整体上或模型整体上是否显著等都需要进行统计检验,而这类检验实质上就是对样本的代表性进行的检验。

2.经济意义检验当我们估算出模型的各参数时,其数值的大小、符号的方向相互之间的关系等内容,是否符合经济理论或经验的要求,以及根据理论或经验的认知能否得到样本资料的支持等方面的检验,就是经济意义的检验。

3.模型要素的计量检验经济模型是由方程式或方程组的形式存在的,我们对各方程中的基本要素,及方程之间的各要素关系等内容,是否符合我们建立的标准和规范的检验就是要素的计量检验。这是计量经济学的主体内容,我们要探寻很多方法来完成。

4.模型的实践性检验根据样本观察所建立的经济模型,如果能够通过上述三类的检验,基本上就是很优秀的模型了。然而为了模型在现实应用中能够达到更优秀的理想要求,有必要在实践的环节中做进一步的检验和改进。而进行这类实践应用性的检验,主要是通过预测的准确性和模型的实用性等使用环节进行的,它是我们检验体系的最后一关,一定程度上也是最重要的一环。所以说真正的通过了检验的模型,是指通过了上述四个方面的检验,才是合格的可以使用的模型。

(四)模型的使用

1.经济结构分析任何经济模型都是对一个经济系统的模拟,其各构成要素与系统整体的数量关系,都可以体现为数量结构和作用程度的关系。这是经济结构分析最为理想的条件,是其他经济分析方法所无法做到的。因此说计量经济分析最主要的功能,就是使经济结构分析成为了可能。

2.经济预测分析经济预测与其他预测一样,多是对未来或未知领域的推测和估算,是人类对未知领域探求的重要手段。而在众多的预测方法中,计量经济模型的预测是最为有效的,它不但可以做出以精确的数值成果的预测,还能够做出其预测结果的把握程度分析。经济预测有时对精度的要求不高,所以对精度较高的计量经济模型来说,预测是其最为简单的应用。

3.经济政策的评价与决策参考在现实的经济决策中,往往是存在着多种选择。而各种选择会产生什么样的后果,则可以通过计量经济模型进行模拟和计算。因此在经济政策制定、评价和模拟测算中,计量经济模型都是最为理想的主要工具之一。

4.经济理论的检验与发展任何经济理论或学说,都可以看作是一系列假设,而这些假设是否成立,需要以实验的方式或方法进行一系列的检验。计量经济学的检验和测算过程就是针对各类假设进行的,其检验的结果可以证实或证伪这些理论或学说。所以说计量经济学的方法,就是经济理论是否科学的检验方法。

二、计量经济建模的核心技术计量经济建模的核心技术

(一)经济思想与理论经济思想是人们对现实经济活动规律的一种初步认识,而经济理论是对经济规律性概括的一种学说体系。由于我们对经济生活观察的视角不同,认识上的差距和错误是客观存在的,因此经济思想或理论的科学性需要得到实践的验证。只有经过检验得到证实的理论,才能称做定律,才是真正的经济理论。而这种实证过程就是计量经济的建模过程,也是我们学习计量经济学的根本目的。计量经济建模的核心就是对我们或别人已有的或不成熟的经济理论、思想、假设、假说等进行实证性质的检验过程。而这些不成熟的待验理论或思想,不仅是经济研究的对象,更是经济建模工作的灵魂,是我们建模工作的第一要素,这也说明经济理论必然是计量经济学的基础。

(二)对现实经济活动的统计观察对现实经济规律进行实证分析的第二个重要因素,就是统计数据。它作为经济现象本身的反映,是检验经济理论的依据。由于多数统计数据都是取样观察的结果,数据都存在着代表性的问题,即是否能全面、系统反映需验证的经济理论的本质特征。由于统计观察的局限性,现实统计数据的属性与经济理论是有关联的,所以不同的数据只能验证其特有的经济理论。例如描述各空间分布状况的截面数据,只能验证现象之间静态经济规律;而时间序列数据往往可以用于验证动态的规律性;那么面板数据才是较全面的统计数据,适合于动静结合的理论验证。因此计量经济学的研究是区分数据类型进行的,即有截面计量分析、时序计量分析及面板数据的计量分析等内容。这三类数据的建模的思路也会有所不同,即截面数据(同一时间对总体中的各不同单位的观察)只能建立静态关系的模型;时间序列(某一机构单位的不同时间表现的数据)可以建立许多具有良好预测性能的简单的基础性模型,例如自回归、移动平均、随机游走等模型;而面板数据(截面空间个体i、时间t、指标信息k的数据结构)可以同时对其静态和动态两方面进行规律性的探索。

(三)实证分析的方法在经济理论与统计数据之间,进行实际验证的方法有很多。而较为科学的经得起考验的就是计量经济方法,它是以回归分析为核心,结合多种检验所形成的实证经济研究的主流方法。实证方法的科学与否,不仅要适合经济理论和统计数据的要求,还要建立一系列的评价标准,来约束和提升各类方法的科学与合理性。这种评价体系可以用于各种猜测的模型之间,以及单一模型中的各变量之间的关系判断,并在判断及不断的改进中选择适合我们要求的理想模型。所以这些标准的建立和使用,也就是计量经济学的主要学习内容了。

统计学变量类型范文4

关键词 专业综合课程实践 机械设计类专业 工程能力

中图分类号:G424 文献标识码:A DOI:10.16400/ki.kjdkz.2016.02.055

专业综合课程实践是机械设计类(方向)的一个重要的实践教学环节,是学完技术基础课程及有关专业课以后的关于专业课程内容的综合实践。通过本实践,把有关课程(机械原理与机械设计,机构分析与综合,机械设计学,机械优化设计,MATLAB综合应用等)中所获得的理论知识在实际中综合地加以运用,提高学生的机械工程分析与综合能力,完成一个工程技术人员在机械设计方面所应该具备的基本技能训练。

1 为何要设置专业综合课程实践

专业综合课程实践是机械设计类(方向)的一门综合性实践课程,旨在训练学生的综合运用所学基础知识和专业知识的能力。

机械设计有众多类型,不同行业有不同的特点和专门要求。如钢铁冶金行业,因其要求连续作业和工作环境极其恶劣,对各种机械设备要求苛刻。又如港口的物流装卸操作作业,对机械设备的要求又完全不一样,作业效率是第一位的要求;例如一艘时速18海里的5万吨级的远洋货轮船,往返7000海里仅仅需要耗时16天,但在6个港口停靠进行物料装卸的作业却长达37天,费用大约占总运输费的40%~60%。

根据我校的实际情况,行业特色和背景皆不是很浓厚,加之实践的条件和场地受限制,所以选取起重机械中的变幅系统作为专业课程综合实践的重点内容,同时又可以在长江岸边的某实业公司重件码头进行实物的实习实践活动。

起重机械①②一般由四大系统(起升系统、变幅系统、运行系统、回转系统)、金属结构、动力设备等组成。四连杆组合臂架型式门座起重机是港口前端装卸作业的主要机型之一,也是我国港口使用最为广泛的设备。变幅系统是四大系统中最复杂和技术含量最高的系统,要求设计综合的知识量也是最高的。

2 专业综合课程实践的综合性

专业综合课程实践要体现出综合性。让学生综合运用多门课程的知识、多种工具解决复杂的机械工程问题,同时又具备可操作性,在规定的二周或三周内能够独立自主完成。

起重机械的变幅系统作为专业综合课程实践的内容正切合综合性的要求。要求学生运用解析法、封闭矢量方法等完成变幅系统的变幅轨迹分析、变幅水平分速度求解、传力特性和变幅力矩分析求解等;同时运用AutoCAD和MATLAB软件包来综合完成实践任务。

3 专业综合课程实践的实践性

起重机械的变幅系统种类繁多,有单臂架和四连杆臂架系统。四连杆臂架系统又分为常规四连杆臂架系统(头部始终向下见图1)和双纽线型臂架系统③④⑤⑥(头部始终向上,见图2和图3);而双纽线型臂架系统又有后摇杆驱动型和臂架驱动型式之分。

在本课程实践的组织中,将课题分为三类:一类为常规四连杆臂架变幅系统,二类是后摇杆驱动双纽线型变幅系统,三类是臂架驱动双纽线型变幅系统。由于一类课题的数据资料相对要丰富些,分组要多一点,但是每组的数据参数是不一样的。具体分组见表1。每组确定一个小组长,这样操作执行要便利些。

学生成果的评定,依据学习态度、出勤率、设计说明书的质量、能否独立完成MATLAB编程与调试、答辩时的思路和回答问题等综合考虑;对于因考研而延迟完成本实践任务的同学,成果评定应该略微降低一些,体现教育的公平公正性。

4 结束语

工程教育需要大量的工程实践,学生的工程能力才能得到锻炼和提高。经过几年的专业综合课程实践的做法和积累,教学相长,不仅一届比一届完成的质量有提高,持续改进,同时教师辅导学生发现问题和解决问题,自己的科研能力也得到了提高,申请了多项软件著作权且均获得成功。

专业综合课程实践的综合性、实践性是必须坚持的总方向和原则。

注释

① 倪庆兴,王焕勇.起重机械[M].上海:上海交通大学出版社,1990.

② 李克勤,姜翠香.刚性四连杆变幅机构的反求设计[J].湖北工业大学学报,2009(2):18-19,25.

③ 李克勤,姜翠香.新型后摇杆驱动四连杆变幅机构的受力分析与程序实现[J].科学技术与工程,2012(13):3231-3234.

④ 李克勤,姜翠香.新型后摇杆驱动四连杆变幅机构的传力特性与变幅力矩分析[J].科学技术与工程,2011(35):8723-8725,8730.

统计学变量类型范文5

笛卡尔曾说:“只有两种方法使人们获得真正的知识,清晰的直觉和必要的推理”。我国大学数学课程的教材和教学中,多着重于数学推理,而对创新能力至关重要的“清晰直觉”的培养重视不够。应注意锻练学生对图像和数值的敏感性,增强其直覚猜测和判断能力。课程的开篇就从图形直观入手:绪论及多元统计图形的表示(对应教材中的第13章,下同)――绪论介绍多元统计分析的参考书、应用等。多元统计图形:多维变量在二维平面上用图形表达,例如折线图、轮廓图、脸谱图、雷达图、星座图。多元正态分布(第1章):本章的介绍注重一元正态和多元正态的对比,强调“温故而知新”。统计距离之马氏距离(第1章):1936年印度统计研究所所长马哈拉诺比斯(P.C.Mahalanobis)提出。介绍欧式距离、闵氏距离、相似系数等多种距离的优缺点,使学生树立起“统计上的方法无对错之分,只有好坏之分”的思想。多元分布数字特征及估计(第1章):对二次型的期望重点介绍,因为后面做参数估计、检验的抽样分布很多都是二次型。多元三大抽样分布(第1章)及在估计和检验中的应用(第2章简介)。专题讲座:相关性度量,取材自著名统计学家张尧庭的讲座“传统统计学有两大基本任务:研究数据变异和相关”。本节介绍相关性度量的依据,分别从不变性、阿达玛不等式、判别信息量三个角度,介绍回归方程的本质,介绍近代统计学的重要概念:熵、信息量等。主成分分析(第5章):由于后面的方法(因子分析、典型相关分析等)会用到该方法,所以方法的学习从主成分分析开始。因子分析(第5章):主要用于降维、评价、排名、聚类等。起源于20世纪初KarlPearson和CharlesSpearmen等人关于智力测验的统计分析。典型相关分析(第8章):多维变量和多维变量的相关性研究。对应分析(第7章):定性数据相关性的研究。聚类分析(第3章):物以类聚,包括系统聚类、快速聚类、模糊聚类、最优分割法等。判别分析(第8章):对有训练样品的数据进行判别归类,包括逐步判别、费歇尔判别、距离判别、贝叶斯判别等。定型数据的建模分析(第9章):定性数据的研究也称为“离散多元分析”,相对于定量数据研究有专门的研究方法。路径分析及结构方程模型简介(第10、11章):是近年心理学、教育学、社会学领域研究潜变量的主要统计方法,成功运用在“顾客满意度”、“主观幸福感”的研究中。

2介绍并提供材料

为了增强学生学习兴趣,随着课程的进行,陆续介绍相关的资料。以2010年度授课提供的资料为例。①人大经济论坛,此论坛资料丰富,有很多案例分析的数据资源。②《女士品茶》统计科普书籍,该书生动有趣,可作案头书。③《北美一流统计学专业课程设置》,了解到很多同学想出国深造,所以提供该研究报告。④2010国内统计学热点研究问题,以此了解统计研究热点问题。⑤《离散多元分析-理论与实践》,主要介绍定性数据分析的理论,以此做相关课程介绍。⑥中国人民大学统计学院2010境外讲学课表,从中可以了解统计学热门研究领域。⑦西南财经大学博士论文《个人住房抵押贷款提前还款风险实证研究》,培养统计方法的综合运用和资料查询。该论文里面用到了因子分析、判别分析、聚类分析、逻辑斯蒂回归等统计方法。

3作业的布置及相关培养

在大学数学课程学习过程中,培养学生应用数学的意识和兴趣,提高学生的应用能力是大学数学课程教学改革的重要方向。根据选课人数分成兴趣小组,以小组为单位留大作业,鼓励大家查找资料、编程、实证分析,处理实际数据,分析解决实际问题的能力,侧重于数学知识的综合应用(见表1)。

4结语

统计学变量类型范文6

摘要:目的:对冠心病心绞痛的蒙医证型进行统计学分析,筛选对证型诊断有意义的指标,制定冠心病心绞痛蒙医证型的诊断标准。方法:按照西医冠心病心绞痛诊断标准选入病例,进行临床观察并填写病例观察表,对每份观察表信息进行辨证并做出相应的证型诊断;根据证型分组,进行统计学分析,筛选对证型诊断有意义的指标。结果:经对100例患者资料进行辨证分析,冠心病心绞痛蒙医证型分布为楚斯型58例,粘邪型23例,胃痧型19例。通过对各证型之间的症状及辅助检查指标进行统计分析,制定出了冠心病心绞痛蒙医证型的诊断标准。结论:本研究通过病证结合临床研究模式总结了冠心病心绞痛的蒙医证型诊断标准,为蒙药的合理应用提供了理论基础。

关键词:冠心病心绞痛 蒙医证型 诊断标准 临床研究

心血管疾病已成为影响人类健康的头号杀手,其中绝大多数是由冠状动脉粥样硬化所致。随着人们生活水平的迅速提高,本病近年来呈增长趋势。冠心病心绞痛属于蒙医学“心刺痛”范畴,目前对冠心病心绞痛蒙医证型的诊断尚未完全一致。本研究收集100例包含蒙医信息的冠心病心绞痛患者的临床资料进行统计学分析,并结合专家意见,初步建立了冠心病心绞痛蒙医证型的诊断标准。

一、临床资料

1.病例入选标准

冠心病心绞痛入选标准依据1979年中西医结合冠心病心绞痛会议制定的诊断标准[1]。

2.病例来源

本研究对象为209年10月-2013年6月期间在本院蒙医心病科、中医心病科及CCU住院诊治的100例患者。

二、研究方法

1.制定病例观察表

通过回顾文献,确定本研究的病例入选标准和观察指标(包括西医和蒙医内容),并据此制定统一的病例观察表。病例观察表包括与冠心病心绞痛患者蒙医诊断相关信息的指标。

2.总体方法

按照西医冠心病心绞痛诊断标准确定入选病例并进行临床观察,填写病例观察表,请蒙西医结合专家对每份观察表信息进行辨证并做出相应的证型诊断;根据证型分组,进行统计学分析,筛选对证型诊断有意义的指标;再请蒙西医结合专家对指标进行讨论,最后制定冠心病心绞痛蒙医证型的诊断标准。

3.观察项目及方法

按照入选标准入选冠心病心绞痛病例,应用统一的病例观察表前瞻性地收集临床资料。主要观察指标包括:性别、年龄、住院转归、冠心病心绞痛发病诱因、既往健康状况、发生冠心病心绞痛的持续时间及发作次数、住院天数,入组72 h内每12 h及心绞痛发作时的心电图、心肌酶[肌酸激酶同工酶(CK-MB)、肌红蛋白(Mb)、肌钙蛋白(cTnT)]、血常规、血生化及血脂[总胆固醇(TC)、三酰甘油(TG)、高密度脂蛋白胆固醇(HDL-C)、低密度脂蛋白胆固醇(LDL-C)]。记录72 h内各指标的值。蒙医指标包括症状、舌象、脉象、体态、根源及因素、疼痛、累及部位等。研究终点为患者在住院期间死亡或放弃治疗。

4.统计学分析

所有观察资料应用SPSS13.0统计软件进行统计分析。对计量资料进行两独立样本t检验,结果以x±s表示;对分类变量资料采用卡方检验。

5.质控措施

采取参研人员培训;研究过程中抽查一定数量(观察病例总例数的10%)病例观察表与原始住院病历进行核对,复印一定数量(观察病例总例数的5%)的原始病历予以存档等方法控制研究质量。

6.数据分析方法

进行统计分析后,找出各证型中对证型诊断有意义的指标。请蒙西医结合专家进行讨论,确定诊断指标。

三、结果

冠心病心绞痛蒙医证型分布经专家对100例包含蒙医信息的冠心病心绞痛患者资料进行分析,其中楚斯型58例,粘邪型23例,胃痧型19例。

1.粘邪型的指标筛选

分析比较粘邪型和非粘邪型的计量资料及两证型间的分类变量资料,结果见表1、表2。表1 粘邪型与非粘邪型血脂比较(略) 表2 粘邪型与非粘邪型分类变量资料统计结果(略)注:症状:1=无,2=有;持续时间:1≥5 min,2≥10 min,3≥15 min,4≥30 min;郝衣希拉体态:1=无,2=有;疼痛程度:1=轻度,2=中度,3=重度; CK-MB、Mb、cTnT:1=正常,2=升高。

2.楚斯型的指标筛选

分析比较楚斯型和非楚斯型的计量资料及两证型间的分类变量指标,结果见表3、表4。表3 楚斯型与非楚斯型血脂比较(略)表4 楚斯型与非楚斯型分类变量资料统计结果(略)注:症状:1=无,2=有;持续时间:1≥5 min,2≥10 min,3≥15 min,4≥30 min;CK-MB、Mb、cTnT:1=正常,2=升高;单纯T波改变:1=正常, 2=单纯T波改变。

3.胃痧型的指标筛选

分析比较胃痧型组和非胃痧型组的计量资料及两证型间的分类变量资料,结果见表5、表6。表5 胃痧型与非胃痧型分类变量资料统计结果(略)注:症状:1=无,2=有;CK-MB、Mb、cTnT:1=正常,2=升高;心电图下壁ST-T改变:1=无,2=有;体态:1=巴达干赫依,2=非巴达干赫依表6 胃痧型与非胃痧型血脂比较(略)。

四、讨论

到目前为止,治疗冠心病心绞痛的药物,如血管紧张素酶抑制剂(ACEI)、β受体阻滞剂、Ca拮抗剂以及阿司匹林等虽然有确切的疗效,但均有不同程度的、较明显的禁忌症,而蒙医药在冠心病心绞痛患者的治疗中却已显示出一定的优势。蒙医药治疗冠心病心绞痛的关键是辨证论治,如何进行辨证是取效的核心内容。本课题就是以冠心病心绞痛的临床证侯信息资料为主,结合现代医学的认识,对其证型赋予新的诊断指标。根据我们研究的结果,冠心病心绞痛患者常见的证型为粘邪型、楚斯型、胃痧型,基本体现了冠心病心绞痛之蒙医心刺痛由于致病四因素(气候变化、饮食、起居和突发因素)的影响所致三根、七素功能失调,赫依血不通,特别是普行赫依受损,精华与糟粕之分解紊乱,导致心脉内淤积浑浊之血液,且由轻到重的病理过程[2-3]。本研究运用现代统计学的方法筛选出每个证型的有意义的临床指标,经专家讨论制定出诊断标准,为寻找对冠心病心绞痛患者有效的治疗提供了理论基础。蒙医证候客观化、标准化及证候本质的研究是实现蒙医药科学化、现代化的必由之路。本研究通过病证结合临床研究模式,总结了冠心病心绞痛的蒙医证型诊断标准,分析结果显示:粘邪型和不稳定性心绞痛有很大程度上的相似性;楚斯型和稳定性心绞痛是一致的;胃痧型主要为下壁心肌缺血引起的心绞痛。蒙医证型诊断为蒙药的合理应用提供了理论基础,拓宽了蒙医药的应用范围,为冠心病心绞痛的治疗提供了新的有效的途径。

参考文献:

[1]陈可冀,廖家桢,尚振祥,等.心脑血管疾病研究[M].上海:上海科学技术出版社,1988.311.

统计学变量类型范文7

关键词:多元统计;聚类分析;判别分析;主成分分析;因子分析;应用

1、引言

多元统计分析是统计学中一个非常重要的分支。在国外,从20世纪30年代起,已开始在自然科学、管理科学、社会和经济等领域拉开了多元统计分析应用的帷幕,20多年来在多元统计分析的理论研究和应用上取得了很显著的成绩。

在商业企业经营过程中,往往需要对诸如产品销售收入、产品销售成本、产品销售费用、产品销售税金及附加、产品销售利润、管理费用、利润总额、利税总额等变量进行分析和研究,如何同时对多个变量的观测数据进行有效的分析和研究,这就需要利用多元统计分析方法来解决,通过对多个变量观察数据分析,来研究变量之间的相互关系以及揭示这些变量之间内在的变化规律。实践证明:多元统计分析是实现定量分析的有效工具。

2、多元统计分析研究的主要内容

在当前科技和经济迅速发展的今天,在国民经济许多领域中,特别是对社会现象的分析,只停留在定性分析的基础上是不够的,为提高科学性、可靠性,通常需要定性和定量的分析。如果说一元统计方法是研究一个随机变量统计科学的规律,那么多元统计分析方法是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。同时,利用多元统计分析中不同的方法可以对研究对象进行分类和简化。

多元统计分析包括的主要内容有:聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析等。

3、多元统计分析方法在商业企业中的应用

在这里,重点研究聚类分析、判别分析、主成分分析、因子分析方法及其在商业企业中的应用。

3.1聚类分析随着生产技术和科学的发展,人类的认识不断加深,分类越来越细,要求也越来越高,光凭经验和专业知识是不能确切分类的,往往需要定量和定性的分析结合起来去分类,于是数学工具逐渐被引进分类学中,形成了数值分类学。后来随着多元分析的引进,聚类分析逐渐从数值分类学中脱离出来形成一个相对独立的分支。

聚类分析又称群分析,它是研究分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类,并计算新类与其它类之间距离,再选择近似者并类,每合并一次减少一类,继续这一过程,直到所有样本都合并成为一类为止。所以,聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果,聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

在企业销售领域,销售商需要考虑对不同生产企业生产的同名称商品的分类问题。例如:某商场对销售的20种啤酒进行分类,以便对不同的类别的啤酒采用不同的销售策略,变量包括啤酒名称、热量卡路里、钠含量、酒精含量、价格。根据以上指标,利用聚类分析可以实现把同一类型的啤酒企业归到同一类别。再如商业企业制定商品销售价格时,需要对某个大城市的物价指数进行考察,而物价指数很多,有农用生产物价指数、服务项目物价指数、食品消费物价指数、零售价格指数等,因而要先对这些价格指数利用聚类分析方法进行分类。

3.2判别分析在生产、科研和日常生活中经常需要根据观测到的数据资料,对所研究的对象进行分类。判别分析是判断样品所属类型的一种多元统计分析方法,其目的是对已知分类的数据建立由数值指标构成的分类规则,然后把这样的规则应用到未知分类的样本中去分类。

判别分析与聚类分析不同,判别分析是已知研究对象分成若干类型并取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析。判别分析按判别的组数来区分,有两组判别分析和多组判别分析;按区分不同总体所用的模型来分,有线性判别和非线性判别;按判别式所处理的变量方法不同,分逐步判别和序贯判别等。判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等。

商业企业在市场预测中,往往根据以往所调查的种种指标,用判别分析方法判断下季度是畅销、平销或滞销。当然,判别分析经常与聚类分析联合起来使用。在聚类分析中,某商场对销售的20种啤酒进行分类,假定分类结果为一级品、二级品和三级品,现在判断新商标的啤酒属于哪个级别的产品就需要用判别分析。

3.3主成分分析在实际问题中,研究多指标(变量)问题是经常遇到的,然而在多数情况下,不同指标之间有一定相关性,由于指标较多,再加上指标之间有一定的相关性,势必增加了分析问题的复杂性。主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标,同时根据实际需要从中可取几个较少的综合指标,尽可能多反映原来指标的信息,这种将多个指标化为少数相互无关的综合指标的统计方法,叫做主成分分析或主分量分析。

在商业经济中用主成分分析可以将一些复杂的数据指标综合成几个商业指数形式,如物价指数、生活费用指数、商业活动指数等。在市场研究中,常常需要分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。顾客偏好分析时常常用到主成分分析。例如:某汽车销售商在商业竞争对手中选择了销售的17种车型,访问了25位顾客,要求他们根据自己的偏好对17种车型打分,打分范围0~9.9,9.9分表示最高程度的偏好。

3.4因子分析因子分析的形成和发展有相当长的历史,最早用以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备,使因子分析的应用和发展受到了很大的限制,甚至停滞了很长时间。后来,由于计算机技术的发展,才使因子分析的理论研究和计算问题有了很大的进展。目前这一方法的应用范围十分广泛,在经济学、社会学、医学等各个学科都取得了显著的成绩。因子分析是主成分分析的推广和应用,它是将错综复杂的随机变量综合为数量较少的随机变量去描述多个变量之间的相关关系,以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类,使类似指标相关程度高,不同类的相关程度低。因子分析分R型因子分析(从相关系数矩阵出发)和Q型因子分析(从相似系数矩阵出发)。超级秘书网

例如:某销售企业对100名招聘人员的销售策略知识和能力进行测试,出了50道题的试卷,其内容包括的面较广,但总的来说,通过应用因子分析方法可以归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏锐和果断程度、思想品德、兴趣爱好、生活常识等,我们将每一个方面称为因子。显然,这里所说的因子不同于回归分析中的因素,因为前者是比较抽象的一种概念,而后者有极为明确的实际意义。因子分析在市场调查分析中也有广泛的应用。例如:对30个调查区的商业网点数、人口数、金融机构服务数、收入情况等20个指标进行因子分析,如果按照一般的分析方法,我们就需要处理20个指标,并给它们以不同的权重,这样不仅工作量变大,而且由于指标之间存在比较高的相关性,会给分析结果带来偏差。另外,给具有较高相关性的众多指标设置权重系数也是一件非常复杂的事情。于是可以考虑采用因子分析的方法,从而减少分析变量的个数,然后再给它们以不同的权数,从而计算出各个调查区平均综合实力得分,以便决定在某个调查区拟建何种类型的销售点。

4、结束语

综上所述,多元统计分析方法的应用均需借助统计分析软件,目前较多使用的有SAS、SPSS等统计分析软件,这些软件均提供了多元统计分析功能。

参考文献

统计学变量类型范文8

关键词:会计信息系统库存决策支持系统库存目标库存模型

一、库存决策支持功能研究对会计信息系统的意义

(一)库存决策支持系统研究现状存货是重要的流动资产,需要占用大量流动资金,一般情况下存货占企业总资产的30%左右。据估算,库存成本降低的潜力比任何其它市场营销环节要大得多,如企业物流成本占营销成本的50%,其中存货费用大约占35%。由此看来,降低存货成本已经成为“第三利润源泉”。在企业管理的其他环节成本降低潜力不大的情况下,在降低存货成本上努力已经是成本管理和企业管理的最终所向(于凌宇、冯玉萍,1998)。从现实状况看,库存管理决策具有对象种类繁多、数量巨大的特点,管理人员被大量的单据、台帐所淹没,信息处理效率低下,造成了对库存供应和需求的变化反映迟钝,库存决策效果差。从管理方法看,多数库存管理一般局限于库存的上下限报警,在提高周转率、库存资金合理分配、优化库存管理等方面意识淡漠,管理方法原始。库存管理引入库存决策支持系统可以发挥计算机信息处理速,辅助管理者做出科学的决策。因此,深入研究库存决策支持功能(Inventory Decision Suppot System,以下简称IDSS)很有必要。目前研究决策支持系统(以下简称DSS)的文献不多。在研究方法上,主要采用演绎法,认为决策支持系统结构应采用多库模型,倡导根据多库模型及理论框架开发系统。然而这些理论只是一种建立相应系统的框架和草图,只提供了一些开发系统最基本的观点和思考问题的角度。只是分别规定了相应系统的组成、结构和功能及内部相互关系以供人们根据工作的需求,建立自己的决策支持系统,但还远没有达到具有可操作、可实现的层次(李京文,2002)。在研究内容上主要集中在特殊库存模型的解法、开发某行业库存决策系统某具体环节、开发某具体企业库存决策支持系统,对开发库存决策支持系统理念和目标探讨的文献不多。

(二)会计信息系统增加库存决策支持功能的可行性及意义会计信息的质量,在很大程度上取决于会计信息能否有助于人们据以进行经济决策和不断提高经济效益的需要,会计的有用性主要指决策的有用性(葛家澍,2001)。对高质量会计信息的需求迫使会计软件从核算型、管理型不断向决策型发展。决策可以分为结构化决策、半结构化决策和非结构化决策,决策型会计软件的开发目前应以开发相对简单的结构化、半结构化决策模块为主,并力求实现与企业管理信息系统的完美融合。库存管理规范性较强,库存决策属于半结构化决策在会计信息系统中加强库存决策支持功能是可行的,原因在于库存决策以销售、采购为条件,通过应用功能完整的进销存模块,会计信息系统可以提供详细的销售、采购环节相关数据及业务信息,为分析销售、采购规律打下基础。会计信息系统提供了各种库存商品、原材料等真实的采购及销售价格,使用成本会计、管理会计计算库存的每种商品及原材料的利润贡献率、各个管理环节消耗的费用,按照商品利润贡献率标准用ABc分类法对商品及原材料进行分类,实现库存重点管理。

库存决策支持功能的研究对会计信息系统具有重大意义:(1)会计信息系统不仅需要提供信息,将来会计信息系统更需要发挥其决策辅助控制功能,通过库存决策支持功能企业可以实现对库存的管理和控制,使系统具有反馈、调节控制功能,为降低库存资金实现科学的库存管理提供保障。(2)库存决策支持功能的需求是会计信息系统进一步发展的动力,要求会计信息系统提供信息的“粒度”更小,同时库存决策支持功能的开发需要对库存管理的数学模型进行更深一步的研究与优化,从而促使会计信息系统的数据管理更详细低层、更全面丰富和科学。(3)库存决策支持能够自动提供新的有价值的指库存指标――缺货率(用缺货的程度反映存货满足用户需求的能力)。现代的企业竞争从价格、质量转到服务竞争,满足客户(顾客)个性化需求是企业的生命,缺货率从反面反映满足客户需求的程度,该指标可以从不同角度计算。根据周期计算公式为:周期缺货率=有缺货的周期/订货周期总数;按年计算的缺货频率克服了不同产品由于不同前置时间引起的不可比性,通过一年的订货周期数(Q/q,Q表示一年的需求,q表示每次采购量)乘按订货周期计算的缺货水平,表示为年缺货率=(Q/q)×(周期缺货概率);根据作业日计算公式为:作业日缺货率=缺货的作业日/总作业日;按照所供应的企业数计算公式为:缺货企业数/供应企业数;按物资数的缺货程度计算公式为:企业数缺货率=缺货量/需求量。

二、库存目标决定库存决策支持系统目标

(一)不同时期的库存目标所决定的IDSS决策目标生产水平和技术发展程度决定企业的目标。早在工业化时期生产的规模不大、市场几乎无限的情况下,企业无需考虑需求、竞争与合作。企业目标为扩大生产能力,节约生产成本赚取高额利润,库存管理关注的重点为如何降低企业自身的库存费用。这种情况下适应社会需求的近代早期的存储论(或库存论)以实现满足需求的情况下存储费用最小化的库存目标,作为实现节约成本赚取利润企业目标的途径。在此目标指导下,开发的IDSS几乎都忽略需求的满足程度而仅将满足需求情况下库存费用最小化作为IDSS的决策目标,这是IDSS不能发挥应有效果最根本原因。进入信息时代后,顾客多元化、个性化的需求日益明显,促使企业生产规模变小,敏捷制造、客户关系管理等新型的经营和管理理念成为企业生存和发展的必然选择,库存管理的重点也单个仓库管理转向从物流学角度分析多级库存、供应链中的库存管理。物流学与供应链管理认为每个企业的库存都是整个供应链的一部分,库存目标为更好的满足客户需求情况下供应链成本最小,即从局部费用(单库存费用)最小发展到整体费用(供应链费用)最小。但以此目标指导IDSS开发和使用缺乏可实现性和可操作性,因为目前国内市场经济发展不成熟,供应链内企业合作、供应链之间的竞争的经营环境没有形成,企业管理水平较低,管理人员的素质不高,供应链管理方法并未得到较好的应用。其次,此目标无法指导IDSS和使用,供应链上的单个企业无法完全控制整个供应链成本,并且带来的收益没有形成合理的分配制度。

(二)IDSS开发与使用构想笔者认为,指导IDSS开发和使用的目标是使“库存贡献”与“库存成本”之差的最大化。其中“库存贡献”与“库存成本”包括显性的、隐性的,可计量的、不可计量的,即库存目标是一个多维目标,不能或很难用一维角度去衡量。库存贡献和库存成本(看作变量)的计量及比较问题是库存目标指导IDSS开发和使用需首要解决的问题。变量的测量实质是对属性的测量,变量的属性对应测量尺度,分别为定类尺度、定序尺度、定距尺度和定比尺度,各种尺度只有定比尺度有绝对零点可

以进行加减运算(李怀祖,2004)。库存目标中的贡献与成本包含许多很难或不可用货币表示数量化的因素,如缺货造成企业信誉及形象的损失、库存对企业发展战略的影响等,需要使用前几种测量尺度度量。变量的比较问题指库存贡献、库存成本使用前几种度量尺度度量无法直接度量,解决的方法即对非定比尺度变量按照一定统一的规则赋值,转化为定比尺度经过四则运算计算出每种库存的“库存贡献”与“库存成本”之差再比较大小。按上述库存目标的指导,笔者对IDSS开发和使用作如下构想:IDSS输入是多维库存策略和多维参数,分两个个阶段数据处理。如果使用时输入库存策略,第一层次数据处理用公式表示为:库存目标集=Ft(库存策略集,参数集),处理Fl表示IDSS根据输入相应的参数值(从采购、销售、系统参数构成的参数集中)及库存策略,计算库存目标集合中各指标的属性值;如果使用时不输入库存策略,第一层数据处理表示为:库存目标集=F2(参数集),处理F:表示系统根据输入的参数集合中各属性值选择库存策略,并计算库存目标集合中各指标属性值。使用输入库存目标与实数影射规则时,第二层数据处理表示为:实数集=G(库存目标集,映数规则集),其中影射规则集是如何把库存目标中的各类变量值赋予某个实数值的规则;反之,系统使用默认的映射规则,数据处理表示为实数集=G(库存目标集)。

三、库存决策支持系统的理论基础与研究方法

(一)库存决策支持系统基础理论 开发IDSS需要相关的基础理论、应用理论作指导,需要借助一定的研究手段、方法研究这一新兴领域。DSS在不少行业和部门获得成功,取得了明显的效益。其理论基础和技术发展到今天离不开相关科学如计算机科学、管理科学、数学、信息科学、人工智能、信息经济学、认知科学等的支持。这些学科构成了其发展的理论框架,以称之为理论基础(张玉峰,2004)。开发IDSS是DSS的具体应用,上述理论也是IDSS的理论基础,并进一步将系统论、预测理论、决策理论、库存管理理论等也作为其基础理论。因为库存是企业大系统的一个子系统,需要系统论为指导处理与其它子系统之间关系;采购、销售、库存决策的外部环境经常变化需要预测理论为指导才能精确预测;决策过程本身比较复杂,只有符合决策理论的库存决策才是科学的决策;库存决策是库存管理链条上的节点,需要其指导。开发IDSS的应用理论包括DSS理论、动态规划理论、统计理论和方法。因为DSS理论是研究如何开发一般的DSS的科学,IDSS是研究对象更为具体的辅助库存决策的DSS;常出现的库存问题是采购、销售量已知,但经常变化且无规律,研究这类问题最简便方法是转化为动态规划问题,使用动态规划求解方法求解;未来采购、销售及其它参数需要运用具体的统计学理论和方法总结规律历史规律,再按照预测理论和方法进行预测。

(二)运用数理统计方法运用库存模型必须已知库存系统内的反映采购、销售业务情况的多个参数值。信息化水平较高的企业保留着大量的销售、采购等业务、财务数据,可以利用概率论与数理统计学的知识及方法总结其规律。能够对采购、销售规律进行研究的根本原因是他们本身具有规律性,各个学科对这些现象作了深入的研究。影响库存决策的采购、销售多数指标(看作随机变量)概率分布常使用正态分布、泊松分布 和指数分布 描述。随机变量满足以下两种条件之一服从正态分布:一是连续受到多个因素影响,并且不受某个特殊因素显著影 响;二是多个随机(一般大于等于9)变量加减运算得出的结果。商品销售量很大且连续(计量单位相对总量很小,可近似连续),如果没有受到特别因素的影响即满足条件一;某类商品有多个子类,每种子类的销售相互独立,则这类商品销售量满足条件二。现实情况企业商品销售满足条件一或二的例子很多,可以用正态分布近似描述销售规律。可以使用多种检验方法检验采用正态分布描述的误差程度,常用的有正态概率纸法和夏皮洛――威尔克(shapiro-Wilk)检验法(峁诗松、程依明、濮晓龙,2004)。有条件的可以使用SPSS统计软件相应的功能模块给出用正态分布描述分布的误差大小。如果随机变量(只取自然数)均值较低(小于等于20)且满足以下条件:随机变量的取值与时间段的长度成正比,与时间段的起点无关;在很短时间段内,随机变量的取值与该时间段以前的状态无关,即满足无后效应;在充分小的时间段内随机变量最大值为一,数学上可以严格证明该随机变量服从泊松(Poisson)分布。如果商品销售不受时间影响且均值不大(小于等于9),容易验证满足上述条件,可以用泊松颁布反映销售量的概率分布情况。商品的平均销售量中等(一般大于9,小于50),且不受特别因素显著影响情况下可以使用指数分布描述。在用上述分布描述销售规律时,检验是否满足分布成立的条件即可。

(三)分析采购销售规律方法与步骤销售(需求)和采购(补充)预测是库存管理和决策的基础。采购、销售预测的效果是由确定预测目标、收集整理预测资料、选择预测方法、建立预测模型、评价预测模型、使用预测模型、分析预测结果每一阶段的效果共同决定。确定采购、销售预测目标是根据库存模型对未来采购、销售规律的需求确定;收集整理采购、销售资料应该根据预测目标要求去收集,包括销售、采购本身发展变化的历史资料。在有条件的信息化水平较高的企业可以将收集的资料扩大到对销售、采购发展变化有重大影响因素的历史资料上,此外还要判别资料的真实程度和可用度。分析企业采购及销售规律可按照以下阶段进行:首先,确定分析对象。分析采购、销售规律是为库存决策服务,只有影响库存决策的各指标才作为分析对象。其次,定性分析。分析采购及销售指标服从分布的类型,一般情况下可以用概率论中已有分布描述指标分布;如果没有对应分布只能用频率代替发生各种情况的概率,则无后面阶段。再次,定性分析检验。根据指标的样本点数据检验假设服从某种分布的误差,误差超出允许范围则否定定性假设,另寻其他方法或用频率代替概率;误差在允许范围内可以进行定量分析。目前统计软件(如SPSS、SAS)具有很好的分析及检验大量样本是否服从某种分布的功能。最后,定量分析及检验。确定各指标的分布函数或分布率的参数值,例如使用点估计、区间估计等方法确定各分布中的未知参数值。对定量分析阶段确定的参数检验其可信度,运用概率论中的“假设检验”理论进行检验。

(四)会计信息系统库存模型研究库存模型是对库存现象抽象、概括、归纳,从数量角度反映库存。研究库存首先抓住库存的本质和主要方面,把库存抽象成库存模型,然后用数学知识对库存模型加以研究得出定量结果。分类是研究问题的开始,可以从库存特征和库存中各参数特征两个角度进行分类。根据库存特点按照不同标准进行可把模型分类如(表1)。求出最优策略,各参数表示的意义如下。P为采购货物的单位价格,也称单位购入成本;C1为单位时间内单位物品的存储费用;c2为单位物品单位时间缺货损失:c3,为每次商品

的订货费用;R为需求速率,即单位时间内的需求;L为前置期,即从订货到第一批商品到达时间段;l为补充时间,即从第一批商品到达至最后一批商品入库时间;Q为订货量,需要指出前置期不为零,则只需在第一批货物到达前一个单位时间订货即可。因此下面所有模型都可以假设前置期为零不允许缺货条件下,可以做分类并计算采用T-循环策略最优库存策略各参数值,见(表2);缺货费用与单位缺货量成正比,设单位缺货量缺货费用C2,采取采用T-循环策略,可作如下表分类并计算最优库存策略见(表3);缺货费用与单位时间成正比,设单位时间缺货费用为C1,可作如下表分类并计算最优库存策略。

表示缺货时间(可根据实际情况按照库存总费用关于增减性确定其最佳取值,可作为已知条件),库存策略为在两个方案选择最优,即比较存在缺货情况下最优库存策略下的单位时间库存总费用(用I表示)和不缺货情况下的单位时间库存总费用(用Ⅱ表示) ,最小值对应的库存策略为最优策略见(表4)。

四、会计库存信息决策支持系统功能分析

(一)数据管理功能该功能内容上包括采集不同来源及格式的原始数据、数据分析、数据预测。采集不同来源及格式的原始数据功能包括数据导入与输入功能。数据导入功能指从系统内部的其他模块或者系统外部(统计软件数据、财务软件的输入数据)导入库存决策支持系统模块中,并转化成所需要的格式,这是大批量数据输入的一种最有效的方式;数据输入功能指作库存决策所需要的相关参数输入到IDSS模块中。数据分析功能是该系统实现库存决策支持功能的基础。数据分析使用的工具比较灵活,可以是专门的数据分析统计模块,也可以是利用系统之外的其他的数据统计分析软件。数据预测功能是假设事物渐进式发展,事物的历史发展规律适合未来,使用某种预测手段对未来事物发展趋势或状态进行预测。预测功能是否准确取决于事物是否具有渐进性;从历史数据中总结的规律是否正确;预测方法使用是否恰当。因此,系统在分析设计数据分析预测功能时,要注意分析数据隐含规律的方法的准确性,预测方法的多样性,事物处于质变阶段就不能使用该分析预测功能模块进行预测。

(二)知识管理功能 知识管理功能内容上包括概率统计学知识、库存模型使用知识、系统参数知识。概率统计学知识包括概率分布知识、参数估计知识、假设检验知识、回归分析知识等;库存模型使用知识给出库存模型使用条件,判断一定参数条件下是否可以套用库存模型及使用模型计算结果误差范围有多大;系统参数知识包括影响库存决策的环境静态参数和变化趋势的知识,如银行利率、利率变化趋势、物价指数、物价变动趋势等。

(三)模型管理功能模型管理功能内容上包括模型选择、模型计算、灵敏度分析。模型选择指根据分析预测模块分析出来的采购、销售、系统参数情况,按照知识库中的模型适用条件知识从模型库中正确选择库存模型;模型运算指根据采购、销售参数、系统参数计算库存方案;灵敏度分析指计算各参数误差对库存方案的影响程度等。

(四)报表输与系统维护功能IDSS所做的工作最终结果是生成库存决策方案,为决策者在库存决策提供帮助。由于商晶种类繁多、数量具大,用户可能对很多的商品建立库存决策方案,甚至一种商品可以建立多个决策方案。在这种情况下,需要提供给用户可以根据自己的需要来选择商品的大类、子类或某种商品以及库存方案的名称进行查询,系统会给出有关的库存方案的运行结果的详细列表以供用户查看,决策者给出相关的查询条件任意查询原始数据、实际数据以及决策结果,对决策效果进行比较。系统维护包括数据备份、用户帐号及权限、数据库维护等。

统计学变量类型范文9

关键词 个体指向方法;整体互动观;配置频次分析;ISOA;LICUR;ROPstat

分类号 B84-06

DOI: 10.16842/ki.issn2095-5588.2016.12.006

1 引言

在过去几十年里,许多有影响力的心理学理论强调了从整体的和互动的视角研究个体发展的重要性(如 Cairns, 1979; Magnusson, 1985)。这种视角主张个体是一个整体,个体的先前行为、基因构成和环境因素作为一个统一整体而运作,因此不能孤立地看待它们对个体心理、行为与发展过程的影响。然而,作为当前科学心理学最普遍使用的方法,变量指向方法(常用技术是相关分析,方差分析和回归分析等)没有将个体看作整体,而是假设个体是可互换的单元,除了随机误差之外,他们在行为发展上不存在质或量的差异(Block, 1971),即总体具有同质性。事实上,在心理学中,总体中的个体常常是异质的,因此应该重视以个体为中心的完整分析(辛自强, 2013)。个体指向方法(person-oriented approach)是一种以个体为中心的分析方法,它的重要任务是确定心理或行为发展的个体差异或异质性(Bergman & Magnusson, 1997)。本文将从理论、技术和挑战等方面系统回顾个体指向方法,另外特别阐明该方法在应用心理学领域的应用现状与前景。

本文之所以确定介绍上述几部分,是因为考虑到国内个体指向研究存在的三方面问题。

第一,在理论与技术方面,尽管个体指向理论是个体指向方法的一部分,但是国内较少有文章系统介绍个体指向方法的理论基础,这不利于研究者在理论的指导下使用个体指向方法。关于数据处理技术,国内的个体指向研究大多使用基于模型的聚类方法(如,陈亮, 张文新, 纪林芹, 陈光辉, 魏星, 常淑敏, 2011),较少使用传统的聚类方法、ISOA、LICUR和配置频次分析。然而,这几种技术也常被用于个体指向研究(如,Garcia, MacDonald, & Archer, 2015),并且这些技术可以通过新近开发出来的用户友好型软件ROPstat执行(Vargha, Torma, & Bergman, 2015)。因此,本文一方面将系统地介绍整体互动观,另一方面除了介绍基于模型的聚类方法,还将介绍其他几种技术的原理、步骤及其在ROPstat软件中的实现方法,以期为个体指向研究者提供模板。

第二,在应用研究领域,当前国内研究者主要将个体指向方法应用于发展心理学(如陈亮, 文新, 纪林芹, 陈光辉, 魏星, 常淑敏, 2011; 赵景欣, 刘霞, 申继亮, 2008),较少将其用于应用心理学研究,但是个体指向方法近年来已经被越来越多地应用于组织行为学(如,Crocetti, Avanzi, Hawk, Fraccaroli, & Meeus, 2014; Mkikangas & Kinnunen, 2016; Meyer, Stanley, & Vandenberg, 2013)与社区心理学(如,Bogat, Leahy, von Eye, Maxwell, Levendosky, & Davidson II, 2005; Bogat, 2009; von Eye, Bogat, & Rhodes, 2006)等应用心理学分支学科。因此,本文将主要介绍该方法在组织行为学与社区心理学中的应用现状及前景。

第三,在方法新进展方面,尽管国内已有文章介绍个体指向方法(纪林芹, 张文新, 2011; 刘坚, 2009),但是近五年该方法又有新发展。除了上文提到的进展,进展还体现在个体指向方法领域的专业期刊Journal for Person-oriented Approach于2014年创刊,在此平台之上理论和方法均有所革新。此外,个体指向方法面临新的挑战(Bergman, 2015; Bergman & Lundh, 2015; Laursen, 2015)。因此,本文将梳理上述进展、挑战与解决方案。

综上所述,本文的第二部分回顾整体互动观,第三部分梳理六种个体指向数据分析技术,第四部分评述个体指向方法在应用心理学领域,特别是组织行为学与社区心理学中的应用现状与前景,第五部分小结该方法的现存问题及解决方案。

2 理论内容

2.1 整体互动观

个体指向方法是个体发展的整体互动系统观(a holistic interactionistic system view)的派生方法。整体互动系统观由Magnusson(1988)提出,将个体视为有机的不可分割的整体,其中互动的成分共同运作,在此过程中形成一个功能性的系统。因此,应该关注作为整体的个体而非部分的变量。

该理论的提出受到三个来源的影响(Bergman & Magnusson, 1997):

(1) 生命科学的发展揭示了生物过程与行为、心理、社会因素相互作用的过程,这使得整合行为的多重解释(如,心理的、生物的与环境的视角)成为可能。

(2) 来源于自然科学(混沌理论、突变理论与一般系统论)的非线性发展系统方法和模型被引入心理学中。

(3) 纵向研究的复兴提供了综合的追踪数据,使得整体互动范式的实行成为可能。

整体主义(holism)和互动主义(interactionism)居于整体互动观的核心。需要指出的是,尽管“整体主义”和“互动主义”这两个术语在不同学科(如,物理学、生物学、哲学和心理学等)已经有较长的历史,整体互动观中的一些观点并非Magnusson首创,但是Magnusson似乎是较早的将整体主义和互动主义整合进一个统一理论框架的心理学家(Lundh, 2015)。

Magnusson的整体主义主要涉及理论问题,即整体和部分的关系。它包括三个假设:不可还原性、不可分解性和自组织性(Lundh, 2015)。其中,不可还原性聚焦于整体,指“整体有超越属于它的部分的性质(Magnusson, 1990, p.197)”,即整体性质不能还原为部分性质之和。不可分解性聚焦于部分,指 “个体的不同方面的功能,因它们在完整个体的综合功能中发挥的作用而获得意义(Magnusson, 2001, p.155)”,即各个部分的功能不能脱离其在整体功能中发挥的作用而独立存在。自组织性是“开放式系统的一个特征”,指“新的结构与模式从现有结构与模式中涌现的过程(Bergman & Magnusson, 1997, p.293)”。上述三种性质也是一个整体性系统的性质。

Magnusson的互动主义主要涉及实证问题,即不同因素之间如何互动,以导致在一个系统中有变化产生。Magnusson认为“互动是开放式系统在各个水平上的中心原则(Magnusson, 1990, p.196)”,强调互动是复杂的、双向的。这意味着“区分自变量与因变量未必有意义,因为一个成分在另一个成分关联的过程中,可能既是原因也是结果(Magnusson, 1990, p.197)”。互动可能是同一系统之内的不同成分之间的交互影响,也可能是不同系统之间的交互影响。

2.2 理论原则

基于整体互动观,Bergman和Magnusson(1997)提出了个体指向方法的5个原则,后来被Sterba和Bauer(2010)概括为6个关键词。据此,本文将个体指向方法的5个理论原则总结如下:

(1) 个体独特性。在一定程度上,发展过程对个体是独特的,这暗示着不同个体的发展可能是异质的。

(2) 复杂互动性。发展过程是复杂的,它包含许多不同水平上的因素,这些因素以一种复杂的方式相互关联着。因为多种因素复杂地相互作用,不太可能找到足以解释某一心理或行为的单一因素。

(3) 个体内变化的个体间差异性。不同个体的心理/行为发展可能形成几种不同的轨迹,同一轨迹之内的个体遵循的发展路径差异较小,不同轨迹之间的个体的发展路径差异较大。

(4) 模式概括性与整体主义。模式概括性是指,发展过程总是包含多个因素,多个因素的联合可以被描述为模式(patterns)或剖面(profiles);模式或剖面通常被用来描述个体,不同的个体可能属于相同或不同的剖面组(profile groups)。整体主义是指,某一因素在心理与行为发展中的作用取决于它和其他因素的互动,离开了其他因素和互动,无从理解这一因素的意义(纪林芹, 张文新, 2011)。因此我们只能通过研究多种因素的联合,即模式或剖面,来理解这些因素的意义。

(5) 模式有限性。描述个体的模式或剖面的数量是有限的。一些模式比其他模式或预期的更经常出现,被称为典型(type);一些模式比其他模式或预期的更不经常出现,被称为特例(antitype; Bergman, Magnusson, & El-Khouri, 2003)。“典型”与“特例”这两个术语常常与一种具体的个体指向分析技术――配置频次分析――关联在一起。类似于“特例”,Bergman和Magnusson(1997)将更不经常发生的模式称为“白点”(white spots)。寻找特例或白点常常是个体指向研究者感兴趣的内容。

关于最后一个原则中提到的特例,尽管是个体指向方法的兴趣点之一,但是并不是变量指向方法的关注点,变量指向方法一般会筛除异常值,计算不同个体的得分均值,最终得出最典型的结果。接下来,本文将对比这两种方法。

2.3 变量指向方法与个体指向方法的比较

变量指向方法与个体指向方法的差异如表1,至少包括目的、假设、优势与分析技术4个方面。

由表1可见,个体指向方法与变量指向方法互为补充,各有侧重地回答不同的研究问题。换言之,个体指向方法并不能替代变量指向方法。为了全面探讨某一问题,许多研究同时包含这两类方法(如,von Eye, Bogat, Rhodes, 2006; Zhang, Xin, Ding, & Lin, 2013; 赵景欣, 刘霞, 申继亮, 2008)。例如,Zhang,Xin,Ding和Lin(2013)为探讨2至5年级小学生类推理能力的发展,一方面,使用变量指向方法,证明类推理能力随年级增长的规律;另一方面,使用个体指向方法,识别出儿童在三种类推理任务中表现的典型与特例,发现了儿童刚刚开始掌握不同推理能力的时间点。为了进一步说明两种方法的关系,本文将在第四部分结合应用心理学的特定主题举例;在此之前将介绍个体指向方法的主要数据分析技术(如表1)。

3 数据分析技术

3.1 聚类分析

聚类分析(clustering analysis)根据个体在一组变量上反应的相似性,将个体分类到相同或不同的亚组,保证亚组内同质性较高,同时亚组间异质性较高(Rand, 1971)。在个体指向背景中,聚类分析的主要目的是识别涌现出的典型模式,这些典型模式可以被看作一个过程的结果,即吸引子状态(Bergman, Magnusson, & El-Khouri, 2003)。

3.1.1 残差分析

在进行聚类分析之前,往往需要识别并删除多变量异常值,即残差个案。如上所述,典型模式是经常被观测到的模式,它们产生于待研究的过程的核心性质。此外,还有一些罕见的观察模式,它们产生于过程的边缘性质、不常见的个体生活事件,或者测量误差。这种模式下个案是残差个案,它们一旦纳入聚类分析,就可能扭曲属于典型模式的个案的分类结构(Bergman, 1988),因此应该删除这些残差个案。具体而言,需要对比成对被试的模式,如果一个个案没有表现出与预先决定数量的其他个案的相似性,即它与最临近个案之间的距离超过距离阈值,那么这个被试被确定为一个残差。其中,距离阈值越小越严格。残差数量一般不超过样本量的3%(Bergman, Magnusson, & El-Khouri, 2003)。

3.1.2 执行程序

在个体指向背景中,常用的聚类分析包括两种类型:

(1) 层次聚类分析,尤其是Ward层次聚类分析。Ward层次聚类分析的思想来源于方差分析,目的是使得各个类别中的离差平方和较小,而不同类别之间的离差平方和较大。其执行步骤是,首先确定距离的基本定义,以及类别之间的距离的计算方式,然后按照距离的远近,把距离较近的数据依次合并,直到所有数据归为一个类别。由于聚类结果可能存在层次关系,因此被称为层次聚类法。该方法倾向于使得各个类别的样本量相近,同时允许变量是连续变量或分类变量。

(2) 非层次聚类分析,尤其是K-means重新定位分析。其执行步骤是:

首先,指定聚类的类别数量(K的含义);接着,根据分析者指定的聚类中心或数据本身结构的中心初步确定原始中心点;

然后,逐一计算各案例到类别中心点的距离,按照最近原则将各个案例归入各个类别,并计算各类别的新中心点(用均值表示,means的含义);

再次,按照新的中心位置,重新计算各案例离中心类别中心点的距离,并重新归类,更新类别中心点;

最后,重复上个步骤,直到达到一定的收敛标准。非层次聚类法要求变量是连续变量,并且对变量的多元正态性和方差齐性要求较高。

在个体指向分析中,常常以Ward层次聚类分析为起点,进一步进行K-means重新定位分析,其中目标被重新定位,以便使被解释的误差平方和百分比(percent explained error sum of squares, EESS%)最大化,类别间异质性最小化(Bergman, Magnusson, & El-Khouri, 2003)。

3.1.3 聚类方案的质量评估与选择

不同于一般的聚类分析,在个体指向方法框架下,当检验聚类方案的内部效度时,类别内同质性往往比类别间异质性更重要。这是因为,基于个体指向理论的预期,典型模式的数值仅仅在变量的一个子集中有差别,这暗示着类别与类别可能离得不远。据此,Vargha, Bergman和Takcs(2016)总结了常用的3类聚类质量系数,这些指标可以用于选择最佳聚类数量。

(1) 最常用的聚类质量系数是EESS%和HCmean。这两个指标本质上是会聚度(类别内的同质性)指标,仅取决于类别内的距离。会聚度越高,结构越好。EESS%衡量聚类方案的类别内同质性,即相比总的样本中心,个案离它们各自的聚类中心更近的程度。HCmean是平均聚类同质性,它通过计算个案的配对的类别内距离均值得到,最好小于1,越接近0越好。

(2) 其次是点二列相关系数。这本质上是总体分离度(类别间的异质性)指标,分离度取决于类别内与类别间的配对距离。在好的聚类方案中,属于相同类别的配对客体之间的距离比属于不同类别的配对客体之间的距离更近。点二列相关系数的值越大越好。

(3) 只有在特殊情况下使用最小分离指标,如silhouette系数。silhouette系数同时考虑内聚度与分离度,值越大,表示相比最近的其他类别中心,个案离自己所属类别的中心更近。Silhouette系数大于0.5表示合理的分类,小于0.2表示数据没有显示出聚类结构(Kaufman & Rousseeuw, 1990)。

此外,当使用多种方法进行聚类,需要对比不同聚类结果时,还可以使用下面的三种方法:

(1) 使用Rand指数衡量两种聚类方法的总的相似性。其计算原理是考虑所有配对的样本,并且计算被分配到相同或不同的类别中的配对数量(Rand, 1971)。Rand指数越接近1,表明两种结果越相似,越接近0,表明两种结果越不同。

(2) 使用精确超几何检验进一步对比不同聚类结果的差异。首先将两种聚类的不同分类进行交叉组合,每个组合有一定数量的个案,个案数量即是观察频次。其次基础模型会产生出一个参照(即,一个估计的期望单元格频次),将其与观察单元格频次比较。如果某个单元格包含的观察频次比模型预期的频次显著更多,那么这个交叉类别构成一个典型;如果观察频次的频次显著更少,那么这个交叉类别构成一个特例。

(3) 使用单样本t检验对比原始数据的质量系数与模拟的随机数据的质量系数。首先通过数据模拟,生成随机数据。随机数据可以由输入变量的独立随机组合的数值组成,或由独立随机均匀分布变量组成,或由独立随机正态分布变量组成。然后使用单样本t检验原始数据的质量系数是否都显著好于随机数据的质量系数均值。这种t检验的独立迭代次数最好超过100(Vargha,Bergman,& Takcs, 2016)。

3.1.4 软件与实例

个体指向聚类分析比常规聚类分析包含更多方法与步骤,ROPstat是较少的可满足需要的软件。具体而言,在该软件中:

(1) Residue模块用于识别与删除残差;

(2) Hierarchal模块和K-means模块用于分别进行层次/非层次聚类;

(3) K-means模块用于计算聚类方案质量系数及其显著性;

(4) Exacon模块计算Rand指数,并进行超几何精确检验对比聚类方案(Vargha, Torma, & Bergman, 2015; Vargha,Bergman, & Takcs, 2016)。个体指向方法框架下的聚类分析应用实例见Garcia,MacDonald和Archer(2015)或Vargha,Bergman和Takcs(2016)。

由于聚类分析是一种启发式的聚类技术,有一定局限性,其替代方法是基于模型的聚类方法(model-based clustering methods),例如潜在类别分析(本文3.5部分)和混合增长模型(本文3.6部分),这类技术通过比较统计模型确定最优聚类方案。尽管如此,聚类分析的优点是对数据模型不要求约束性假设,而且符合个体指向方法的理论原则。当变量是数值变量,且研究具有探索性质时,聚类分析仍是常用的个体指向数据分析技术。

3.2 配置频次分析

配置频次分析(configural frequency analysis, CFA)适用于多变量交叉分类的分析,变量是分类变量(von Eye, Mair, & Mun, 2010)。“配置”指单元格所代表的模式。CFA的目标是通过显著性检验,将单元格内的观察频次与期望频次比较,识别典型与特例――前者指观察频次比期望频次显著更高的配置,后者指观察频次比期望频次显著更低的配置。

3.2.1 执行程序

一般CFA的执行程序包括五步(von Eye, Mair, & Mun, 2010):

第一步,选择基础模型,估计期望频次。CFA的基础模型是一个随机模型,该模型估计一个配置预期发生的概率。大多数CFA的基础模型是对数线性模型,该模型假设分类变量之间具有独立性(变量独立性假设)。与之相反,CFA的前提假设是变量之间相互关联,旨在发现典型和特例。只有当对数线性模型的变量独立性假设被拒绝时,才能进行CFA。

第二步,确定偏离于模型的变量独立性假设的标准。当前大多数CFA采用的是依赖于边际频次的方法。其中一种依赖于边际的度量指标是Pearson χ2检验中的Φ系数。Φ系数衡量两个二分变量之间的关系强度,即衡量偏离于两变量独立的基础模型的程度。

第三步,选择显著性检验的类型。在任意抽样方案之下,可使用的显著性检验包括Pearson χ2检验,z检验和精确二项式检验。在乘积-多项抽样方案之下,可使用的显著性检验包括Lemacher精确检验和近似超几何检验。

第四步,在控制α之后进行显著性检验,识别典型与特例。无论将CFA用于探索研究还是验证研究,都需要进行多个显著性检验,对每个配置分别进行观察频次与期望频次的比较。当对所有配置进行大量的显著性检验时,存在利用偶然机会的高风险。为了防止α膨胀,CFA总是会使用控制显著性阈值α的程序。传统方法是Bonferroni法,调整后的α=α / t。其中t是所有变量的交叉分类的单元格数量。假如有288个单元格,将α设定为0.05,那么α*等于0.0001736。由于这种方法比较保守,当前使用较多的方法是Holm法。

第五步,典型与特例的识别与解释。进行显著性检验之后会涌现出一定数量的典型和特例,需要解释这些典型和特例的含义。

CFA适用于对横截面数据进行分析,确定典型或特例。此外,CFA也适用于分析纵向数据,对预测变量和结果变量的关系,以及不同变量发展变化间的联系进行分析。例如CFA的变式之一,预测配置频次分析(von Eye & Bogat, 2005)。该模型也是一种识别典型和特例的分类数据分析技术,但是它被用于识别预测变量(一般按时间顺序重复测量)的一个特定配置与结果变量的关系。预测配置频次分析的基础模型中包括预测变量与结果变量,解释了重复测量之间的一阶和二阶自相关。与CFA的一般程序类似,当发现基础模型的独立性假设被拒绝时,可以认为结果不能被预测变量的主效应及预测变量之间的相关所解释,因此预期典型或特例存在,进而识别这些典型与特例。

3.2.2 软件与实例

ROPstat软件中的CFA模块可以执行CFA,其基础模型是对数线性模型;关于偏离模型的变量独立假设的标准,采用的是依赖于边际频次的方法;显著性检验的类型是精确二项式检验;校正α的方法是Holm法。如果想设定其他条件或使用其他的CFA检验方法,可考虑使用von Eye开发的CFA程序(http://dgps.de/fachgruppen/methoden/mpr-online/issue4/art1)。

PCFA的应用实例参见Martinez-Torteya, Bogat, von Eye和Levendosky(2009)。另外,von Eye,Mair和Mun(2010)包括CFA的各种变式及其应用实例。CFA的应用实例如Zhang,Xin,Ding和Lin(2013)。他们使用CFA探讨儿童类推理能力的发展。来自小学4个年级(2~5年级)的儿童完成了三种类推理任务,分别是类包含、替代包含与二元律任务,每种任务有4个题目,每个题目有4个选项。对于每个题目,两个变量(年级与答案)组成16个可能的配置(年级变量共4个水平,为2、3、4、5;答案变量共4个水平,更多、一样多、更少、不确定)。

为了方便比较,本文分别选取3类类推理任务中的第1个题目,将CFA的结果重新整理,见表2。其中CI 1是类包含任务,题目为“世界上的苹果比水果更多,苹果和水果一样多,还是苹果比水果更少?还是你不确定?”;VI 1是替代包含任务,题目为“世界上的梨子比非香蕉更多,梨子和非香蕉一样多,还是梨子比非香蕉更少?还是你不确定?”;LD1 是二元律任务,题目为“世界上的非水果比非梨子更多,非水果和非梨子一样多,非水果比非梨子更少?还是你不确定?”。3个题目的正确答案均是“更少”。

如果上述前提得到支持,可以使用ISOA。如果得不到支持,可使用一种替代性技术――LICUR。

3.3.3 软件与实例

在ISOA技术中,与聚类分析有关的软件实现方法在上文已做介绍。ROPstat还可以实现:

(1) Time separation模块用于执行上述ISOA程序的第一步;

(2) Time fusion模块用于执行第四步;

(3) Exacon模块和CFA模块用于执行第五步;

(4) Centroid模块用于检验结构不变性假设;

(5) K-means模块检验成员资格不变性与相对同质性类别假设。应用实例见Bergman,Nurmi和von Eye(2012)或Hiatt, Laursen, Mooney和Rubin(2015)。

3.4 LICUR技术

在使用LICUR(Linking of cluster after removal of residue; Bergman,Magnusson,& El-Khouri, 2003)时,需要分别对每个时间点的变量进行聚类分析,之后通过对比一个时间点的聚类方案与其他时间点的聚类方案,评估模式发展的结构稳定性/变化与个体稳定性/变化。这两种稳定性/变化的概念与ISOA中类似。与ISOA类似,LICUR中的稳定性/变化也可以通过流程图表示。

3.4.1 执行程序

LICUR的执行步骤是(Bergman, Magnusson, & El-Khouri, 2003):

第一步,对每个时间点的数据分别进行残差分析,识别并删除聚类变量的数值模式与样本中其他个体都不匹配的个体。

第二步,对每个时间点的数据使用Ward层次聚类分析。聚类方案的有效性可以通过上文提到检验方法评估。聚类数量的决定方法还可以参考Bergman,Magnusson和El-Khouri(2003)提出的四个标准:

(1) 聚类方案在理论上有意义,而且明显不同且在理论上可区分的两个类别,没有在最后的聚类方案中被合并为一个类别。

(2) 类别数量最好不超过15个,通常不少于5个。

(3) 在聚类方案中,EESS%的突然降低可能代表这种方案包括的类别不够多,这种方案不是最理想的。

(4) EESS%最好超过67%。参照上述标准,得到一种最佳聚类方案。如果想要尽可能地获得同质性类别,Ward聚类方案可以被当作起点,进一步进行K-means重新定位聚类分析。

第三步,将两个临近时间点的聚类方案连接成为交叉表,检验结构与个体稳定性/变化:

(1) 结构稳定性/变化指在不同时间点发现的模式的相似性/变化。如果这种相似性高,那么在两个的时间点的聚类的质心距离(如欧式距离平方的均值,ASED)较小。

(2) 个体稳定性/变化反映了个体的模式发展路径,即从一个时间点的某个类别转变到后一个时间点的相同或不同类别。需要对交叉表中每个单元格进行精确超几何检验,这种检验中的比率是观察频次与期望频次的比值,表示从一个类别转换到相同/不同类别的可能性。通过这种检验可以发现模式发展路径中的典型与特例。

3.4.2 软件与实例

在LICUR技术中,与聚类分析有关的软件实现方法在上文已做介绍。ROPstat还可以实现:

(1) Centroid模块用于检验结构稳定性/变化;

(2) Exacon模块用于检验个体稳定性变化。LICUR技术的应用实例如Trost和EI-Khouri(2008)。这项研究使用纵向数据,探讨同一批瑞典女性在10岁、13岁和43岁三个时间点的学业表现和心理问题的模式发展路径。

3.5 潜在类别聚类分析

潜在类别分析(latent class analysis, LCA)与潜在剖面分析(latent profile analysis, LPA)可以合称为潜在类别聚类分析(latent class cluster analysis, LCCA; Vermunt & Magidson, 2002)。与聚类分析相比,LCCA有更多的拟合指数对不同的分类结果进行评价和比较,从中选出最合适的聚类方案,并计算相应的后验概率将被试分配到各潜在类别中(张洁婷, 焦璨, 张敏强, 2010)。LCA与LPA的相同之处是潜变量都是分类变量,不同之处是LCA的外显变量是分类变量,LPA的外显变量是连续变量;LCA的模型是概率分布,LPA的模型是密度分布。因为两种方法的原理和实行步骤相似,本文将主要介绍LCA的模型原理与实行程序。

3.5.1 模型原理

LCA的基本思想是用较少的、互斥的潜在类别变量来解释各外显变量的各种反应的概率分布,潜在类别变量中每种类别对外显变量的反应都有特定倾向(邱皓政, 2008)。换言之,LCA试图用一个潜分类变量X来解释K个外显类别变量的关系,使得外显变量的关系在经过X的估计后能够维持其局部独立性。

3.5.2 执行程序

LCA的执行步骤如下(邱皓政, 2008):

第一步,估计初始模型(只有一个类别的模型)。类别为1的模型即零模型,此时没有在外显变量背后设定潜变量。此时使用卡方显著性检验(Pearson χ2检验, G2检验)进行模型适配度检验,显著的卡方值(如p

第二步,逐步增加类别数目,进行不同模型的参数估计,计算模型适配性。关于参数估计,LCA中模型求解的方法主要是极大似然法,其迭代过程一般采用EM、NR等不同算法。同时,需要计算不同类别数目的聚类方案对应的模型拟合的指标,包括:

(1) 卡方检验的卡方值及其显著性。当潜变量类别数目由1继续增加,卡方统计量一般会逐步减少,当达到一定数目后,模型达到良好适配(p>0.05)。

(2) 信息评价标准,如AIC、BIC。AIC适用于模型优劣的比较,其计算由极大似然算法来推倒,值越小表明适配越好;BIC弥补了AIC没有考虑样本量的问题,BIC比AIC更适用于样本数达到数千人以上,或模型中参数数量较少时(Lin & Dayton, 1997)。

(3) Entropy。Entropy指数是衡量分类精确程度的指标,取值介于0到1,越接近1代表分类的精确度越高。Lubke和Muthén(2007)发现,entropy低于0.6一般表示错误地对大约20%或更多的被试进行了分类,entropy等于0.80及以上表明对至少90%的被试进行了正确分类。

(4) BLRT(bootstrap likelihood ratio test)和LMR检验。这两个指标用来比较潜在类别模型的拟合差异。BLRT检验bootstrap抽样获得k个类别与k-1个类别的模型的对数似然比差异,LMR方法检验k个类别与k-1个类别的模型的对数似然比差异,如果差异p值达到显著水平,那么可以认为k个类别比起k-1个类别的方案有了明显改善。有研究(Nylund, Asparouhov, & Muthén, 2007)发现LMR检验倾向于高估类别的数目,BLRT在正确识别类别的正确数目方面有更高的精确性。

第三步,进行模型适配性检验与差异检验,决定最优模型。通过综合比较第二步得出的卡方检验不显著的那些模型中的信息评价标准(越小越好)、Entropy(越大越好)、BLRT和LMR检验(显著则代表k个类别优于k-1个类别),同时兼顾理论、模型简约性和结果可解释性(Jung & Wickrama, 2008),决定最佳的类别数目。

第四步,进行类别的命名与参数估计结果整理。在决定最优模型之后,需要报告参数估计的结果,即报告潜在类别概率与条件概率,应用条件概率对潜在类别进行命名。

第五步,进行分类并决定各观察值的归属类别。经过上述步骤,可以得到潜在类别与外显变量的对应关系,进一步将观察值分到不同的类别中。此后,可以进行变量指向的分析,即检验不同类别的个体在其他变量上的差异。

3.5.3 软件与实例

邱皓政(2008)使用LCA对SARS期间心理与行为问题进行探索式分析,其中包含执行LCA各步骤的Mplus程序语句(pp.69-86)。

3.6 增长混合模型

增长混合模型(growth mixture modeling, GMM)用于处理群体异质增长问题(Muthén & Muthén, 2000),它可以弥补潜增长曲线分析(latent growth curve analysis, LGCA)和潜在类别增长分析(latent class growth analysis, LCGA)的缺点。这是因为LGCA是一种变量指向方法,它无法描述遵循不同发展轨迹的个体亚组;LCGA是一种个体指向方法,它尽管可以描述发展轨迹不同的个体亚组,但是不允许参数增长存在亚组内变异;相比而言,GMM既可以描述不同的变化类,又能够自由估计类别内的变异。

具体而言,LGCA使用的模型是潜增长曲线模型(latent growth curve modeling, LGCM),它假定群体中所有个体来自于同一个总体,因此可以用同一个平均增长轨迹(轨迹的截距和斜率相等)描述所有个体的心理或行为增长轨迹。然而,在更大的总体中,个体间的差异较大,其增长轨迹不能用同一个平均增长轨迹描述。这时,可以替代LGCA的方法是LCGA。LCGA使用的模型是潜在类别增长模型(latent class growth modeling, LCGM),LCGA通过将潜在类别变量引入潜增长曲线模型,描述不同潜在类别的增长轨迹,即不同的潜变化类。此时,LCGM将每个类别内的增长因子的方差和协方差估计值固定为0,也就是假定同类别内的个体享有相同的平均增长轨迹。然而,同类别的增长轨迹仍然可能有个体间变异。这时候需要用GMM替代LCGA,因为GMM既估计同一个类别内的平均增长轨迹,又估计增长因子的变异。上述分析表明,LGCA往往是GMM分析的起点,LGCM和LCGM均是GMM的特例。

3.6.1 模型原理

GMM通过两类潜变量描述个体之间增长趋势的差异(刘红云,2007; 王孟成, 毕向阳, 叶浩生, 2014):

(1) 分类潜变量,将群体分成互斥的潜在类别亚组,以便描述群体的变化类;

(2) 连续潜变量,描述初始差异(随机截距)和发展趋势(随机斜率)。包含这两种潜变量的模型是最基本的GMM。GMM也可以加入协变量和结局变量,协变量影响分类潜变量、增长截距/斜率和结局变量,分类变量影响结局变量。这里的协变量也可以称为自变量,其数据可以是任何类型(分类、连续或计数)。GMM的观测变量一般是连续变量,此时默认的参数估计方法是稳健较大似然估计。

3.6.2 执行程序

GMM的执行程序如下(Jung & Wickrama, 2008):

第一步,估计初始模型。GMM的初始模型一般只有一个类别,其中不包括协变量,相当于LGCM。此时常用的模型拟合指数有(Kline, 2015):

(1) CFI和TLI,建议参考值是大于0.90,越大越好;

(2) RMSEA,建议参考值是0.05,越小越好;

(3) AIC和BIC,越小越好。如果LGCM中截距或斜率因子的方差估计值显著,说明个体在初始水平或增长速度上存在个体间差异(王孟成,毕向阳,叶浩生, 2014),有必要进行GMM。

第二步,在初始模型的基础上增加类别数目,提取出不同类别的LCGM,对于类别数目不同的模型进行参数估计,计算模型拟合度和模型拟合检验。在确定一个GMM模型之前,LCGM是一个有用的初始模型;二者主要的差别在于,LCGM假定在增长因子上没有类别内变异,GMM可以自由估计类别内变异。LCGM将类别内变异固定为0有助于识别出更清楚的类别,并且计算负担更少。GMM可以将各亚组内的方差设定为跨类别组等同或自由估计。该步骤中的LCGM和GMM是不包括协变量的无条件模型。

第三步,综合模型适配性指标和实际意义,决定类别数量。一般需要报告不同模型的卡方统计量、BIC、AIC、Entropy、BLRT和LMR检验结果。具体评估方法和LCA相似。

第四步,纳入协变量,估计有条件模型,即包含协变量的LCGM和GMM模型,重复上述第二步和第三步。这是因为,如果协变量对增长因子(截距和斜率)和潜在分类变量有直接的影响,那么观测变量与潜在分类变量的关联可能出错,上述步骤中使用的无条件模型可能导致歪曲的结果。因此,需要在上述的无条件模型后估计有条件模型。

第五步,进行类别的命名和参数估计结果整理。在决定最优模型之后,需要报告:

(1) 类别概率,即每个轨迹亚组的人数比例;

(2) 增长因子的估计值,即不同轨迹亚组的截距和斜率均值及其检验结果,根据这些信息对类别进行命名;

(3) 后验概率,即每个个体被正确分类的概率大小,越接近1说明正确分类的可能性越大;

(4) 协变量对轨迹增长的影响的系数估计值与显著性检验,这可以说明自变量对某一心理或行为特质的初始值(截距)和增长速度(斜率)的影响。

第六步,进行分类并决定各观察值的归属类别,以便进一步进行其他类型的分析。

3.6.3 软件与实例

Jung和Wickrama(2008)全面梳理了执行GMM各步骤的Mplus程序语句(pp.307-315)。GMM的特例――LCGA的实例见魏子晗,詹雪梅和孙晓敏(2015)。该研究描述实验室情境中腐败行为的3种变化轨迹,并考察风险概率和可控性对不同变化轨迹的影响。GMM的实例见王孟成,毕向阳和叶浩生(2014)。

4 在应用心理学中的应用现状与前景

4.1 组织行为学

近年来,个体指向方法被越来越多地应用于组织行为学,或更宽泛意义上的组织科学的研究,其中涉及的主题至少包括工作认同(Crocetti, Ava-nzi, Hawk, Fraccaroli, & Meeus, 2014),工作倦怠(Mkikangas & Kinnunen, 2016),与组织承诺(Meyer, Stanley, & Vandenberg, 2013)。本文将以后两个主题为例,说明个体指向方法将如何丰富与扩展组织行为学的传统主题。

4.1.1 工作倦怠研究

关于工作倦怠的研究始于上个世纪70年代中期,40多年来大多数相关研究使用变量指向方法(Leiter, Bakker, & Maslach, 2014)。最近10年,越来越多的倦怠研究开始使用个体指向方法(如,Innanen, Tolvanen, & Salmela-Aro, 2014)。近期,Mkikangas与Kinnunen(2016)系统回顾了近10年发表的,使用个体指向方法研究工作倦怠的24篇论文。这些论文的主题包括:

(1) 倦怠症状的个体内模式,即倦怠类型;

(2) 倦怠症状的个体内发展轨迹,即倦怠轨迹;

(3) 个体内的幸福指标的模式,即倦怠与幸福指标组合形成的类型。

个体指向研究与以往的变量指向研究相比,既有相似结果也有新发现。相似结果表现在倦怠轨迹上,两种方法都表明工作倦怠有跨时间的绝对的稳定性(员工的倦怠始终保持在一定的水平)与自比的稳定性(一名员工在不同时间属于相同的倦怠类型)。新发现体现在,以往的变量指向分析表明倦怠的两个成分(衰竭与工作怠慢)彼此高度正相关,但是个体指向分析可以发现倦怠的成分之间的关联模式,经常出现的典型是:

(1) 在三个成分(衰竭、工作怠慢与工作效能感)上得分都很低的亚组;

(2) 在三个成分上得分都很高的亚组;

(3) 与在衰竭与工作怠慢上得分很高,但在工作效能感上得分很低的亚组。

综合来看,个体指向研究通过揭示个体倦怠的典型与特例,将为变量指向研究提供重要的补充,同时将为工作倦怠研究提供新洞见。值得一提的是,Mkikangas和Kinnunen(2016)综述到的研究大多是由北欧研究者进行的(占比58%),这与个体指向方法发源于瑞典有关,暗示着工作倦怠的个体指向研究仍处于初期阶段。

4.1.2 组织承诺研究

Meyer与Allen(1991)提出组织承诺三成分模型,将组织承诺划分为情感承诺(个体对组织的情感认同,以下简称AC)、规范承诺(与留在组织有关的责任的感知,以下简称NC)与持续承诺(个体感知到的离开组织的成本对个体行为的约束,以下简称CC)。此后的二十多年里,大部分相关研究使用变量指向方法,探讨承诺的三成分(承诺成分)如何预测个体的行为,以及关于不同对象的承诺(承诺焦点)之间的关系。然而,变量指向方法不能解决以下问题:

(1) 承诺成分以及承诺焦点的复杂交互作用;

(2) 待研究的样本是异质的,存在未被发现的亚组;

(3) 关于承诺的三成分彼此联合,形成不同剖面的理论命题。为了研究这些问题,越来越多的组织承诺研究者开始使用个体指向方法(Meyer, Stanley, & Vandenberg, 2013)。

与变量指向方法相比,个体指向方法扩展了组织承诺研究的以下主题:

(1) 承诺的多项成分组合形成的亚组。例如,Wasti(2005)使用K-means聚类分析,发现土耳其员工表现出不同的组织承诺剖面组,包括完全承诺(三项分值较高)、不承诺(三项分值较低)、AC占优(AC分值较高)、CC占优(CC分值较高),与AC/CC占优(AC与CC分值较高)等亚组。Somers(2010)后续的研究发现完全承诺组与AC/CC占优组表现出最低的离职率。

(2) 承诺的多个焦点组合形成的亚组。例如,Morin, Vandenberghe, Boudrias, Madore, Morizot和Tremblay(2011)使用潜在剖面分析,分析员工对7个焦点(组织/工作小组/上司/顾客/职业/工作/职业生涯)的AC评分,识别出5个剖面亚组,包括对所有焦点高承诺、对所有焦点低承诺、对上司高承诺并对其他焦点中承诺、对职业生涯高承诺而对其他焦点低承诺,以及对最近的工作环境(组织/工作小组/顾客)高承诺。这些剖面组在绩效与组织公民行为方面有所不同。

(3) 承诺的不同成分的个体发展轨迹。例如Kam, Morin, Meyer和Topolnytsky(2016)使用潜在转变分析(王碧瑶, 张敏强, 张洁婷, 胡俊, 2015)检验员工在承诺亚组中的成员资格如何随着组织变革而变化,调查的时间点1是组织宣布变革之前的1个月,时间点2与时间点1之间间隔8个月。结果识别出5个剖面组,分别是AC/NC占优、AC占优、所有成分中等但AC占优、所有成分中等但CC占优,以及CC占优,并发现员工在不同承诺剖面组中的成员资格具有跨期稳定性。

在上述三个方向中,最后一个方向是当前组织承诺的研究热点。这是因为当代工作世界中关于承诺的最有趣的问题是员工承诺的个体发展过程(Meyer & Morin, 2016),而且组织行为学中有超越横截面设计,转而使用纵向设计的方法学风向转变(张志学, 鞠冬, 马力, 2014)。这些条件的共同作用将促使组织承诺研究者越来越多地使用个体指向方法。

4.2 社区心理学

密歇根州立大学的Bogat教授是较早将个体指向方法引入社区心理学的学者。Bogat,Leahy,von Eye,Maxwell,Levendosky和Davidson II(2005)使用配置频次分析探讨社区暴力、亲密伴侣暴力与妇女心理健康的关系,这是在社区心理学专业期刊发表的较早的个体指向研究。不久之后,在2008年第116届APA年会社区心理学分会上,作为美国社区研究与行动协会的主席,Bogat(2009)发表主席致辞,专门论证将个体指向方法引入社区心理学的必要性。其中,个体指向方法与社区心理学的接口可归纳为两个方面。

4.2.1 社区干预项目评估

社区心理学家经常需要评估社区干预项目的成效。他们通常采用变量指向的方法,将被试随机分配到干预组与控制组,通过检验两组的差异来评估干预是否达到了预期效果。然而,这种方法的结果可能存在误导性。

例如,von Eye,Bogat和Rhodes(2006)通过分析一个社区干预项目中的控制组的数据,来探讨父母对孩子饮酒的态度如何影响社区青少年的饮酒天数。变量指向分析(方差分析)的结果表明,调查时间与性别对饮酒天数有显著的交互作用,男孩的饮酒天数在两次调查之间有所下降,女孩的饮酒天数有所增加。然而,这个交互作用的效果量相当小(偏η2=0.009),这可能是大样本(N=3558)导致的统计检验力异常造成的,同时暗示着样本中可能存在异质的亚组。事实的确如此,个体指向分析(配置频次分析)识别出一个典型,包含1500名女孩(占样本量的64%),她们预期父母对她们饮酒非常沮丧,在前后两次调查中均报告从未饮酒――她们是不符合总体趋势的被试亚组。上述分析是基于控制组的数据,但是道理也适用于社区干预项目评估。由此可见,变量指向方法可以发现干预效果的一般趋势,而个体指向方法可以识别出符合与不符合一般趋势的亚组,兼用两种方法将有助于全面评估社区干预项目的效果。

4.2.2 生态视角下的社区心理学研究

个体指向方法与社区心理学中的生态模型有相似之处。社区心理学家Kelly是生态模型的早期倡导者,他认为互依性是生态视角的特点,提倡社区心理学家应该研究人际关系,人与环境的关系,一个社会系统与另一个社会系统的关系(Kelly, Ryan, Altman, & Stelzner, 2000)。整体互动观也认为,系统中一个成分的某种改变必将影响另一个。根据这种联系,Bogat(2009)提倡使用个体指向方法研究个体与环境的交互作用。

上文提到的Bogat,Leahy,von Eye,Maxwell,Levendosky和Davidson II(2005)关于社区暴力、亲密伴侣暴力与妇女心理健康问题之间的关系的研究即是这种尝试的案例。Bogat等(2005)使用配置频次分析,发现社区暴力不能负向预测心理健康水平,这不同于以往变量指向研究的结果。这项研究的意义是,它提醒那些关注社区暴力及其后果的社区心理学家,也提醒支持生态视角的社区心理学家:

第一,变量指向研究的结论可能是对的,但也许不能推广到其他个体亚组,例如上述研究中的妇女。

第二,变量指向研究整合了很多个体的数据,其结论或许能反映一般趋势,但也许不能反映总体中的特定个体的变量关系。个体指向方法作为变量指向方法的重要补充,将丰富社区心理学关于个体与环境互依性的研究。

5 问题与挑战

个体指向方法尽管具备上文提到的诸多优势,并且应用的领域也越来越广泛,但是仍然存在一些问题与挑战。其现存问题可分为理论基础问题与方法应用问题(见表3)。

5.1 理论基础问题

个体指向方法的理论基础问题至少包括3个方面:术语混淆、不能证明因果关系,以及方法的探索式性质与不重视预测。

Kaufman, L., & Rousseeuw, P. J.(1990). Finding groups in data: an introduction to cluster analysis. New York, NY: John Wiley & Sons.

Kelly, J. G., Ryan, A. M., Altman, B. E., & Stelzner, S. P.(2000). Understanding and changing social systems: An ecological view. In J. Rappaport & E. Seidman (Eds.), Handbook of community psychology (pp. 133-159). New York: Springer US.

Kline, R. B. (2015). Principles and practice of structural equation modeling. Guilford publications.

Laursen, B.(2015). I don-t quite get it… personal experiences with the person-oriented approach. Journal for Person-oriented Research, 1(1-2), 42-47.

Laursen, B., Furman, W., & Mooney, K. S.(2006). Predicting interpersonal competence and self-worth from adolescent relationships and relationship networks: Variable-centered and person-centered perspectives. Merrill-Palmer Quarterly, 52(3), 572-601.

Laursen, B., & Hoff, E.(2006). Person-centered and variable-centered approaches to longitudinal data. Merrill-Palmer Quarterly, 52(3), 377-389.

Laursen, B., Pulkkinen, L., & Adams, R. (2002). The antecedents and correlates of agreeableness in adulthood. Developmental Psychology, 38(4), 591-603.

Leiter, M. P., Bakker, A. B., & Maslach, C.(2014). The contemporary context of job burnout. In M. P. Leiter, A. B. Bakker, & C. Maslach (Eds.), Burnout at work: A psychological perspective (pp. 1-9). Hove, Sussex: Psychology Press.

Lin, T. H., & Dayton, C. M.(1997). Model selection information criteria for non-nested latent class models. Journal of Educational and Behavioral Statistics, 22(3), 249-264.

Lubke, G., & Muthén, B. O. (2007). Performance of factor mixture models as a function of model size, covariate effects, and class-specific parameters. Structural Equation Modeling, 14(1), 26-47.

Lundh, L. G. (2015), Combining holism and interactionism: Towards a conceptual clarification. Journal for Person-oriented Research, 1(3), 185-194.

Magnusson, D. (1985). Implications of an interactional paradigm for research on human development. International Journal of Behavioral Development, 8(2), 115-137.

Magnusson, D. (1988). Indiviolual development from an Interactional perspective: A longitudinal study. Lawrence Erlbaum Associates, Inc.

Magnusson, D. (1990). Personality development from an interactional perspective. In L. Pervin (Ed. ), Handbook of personality (pp. 193-222). New York: Guilford.

Magnusson, D.(1999). Holistic interactionism: A perspective for research on personality development. In L. Pervin & O. John (Eds. ), Handbook of personality (pp. 219-247). New York: Guilford.

Magnusson, D. (2001). The holistic-interactionistic paradigm: Some directions for empirical developmental research. European Psychologist, 6(3), 153-162.

Mkikangas, A., & Kinnunen, U.(2016). The person-oriented approach to burnout: A systematic review. Burnout Research, 3(1), 11-23.

Martinez-Torteya, C., Bogat, G. A., Von Eye, A., & Levendosky, A. A. (2009). Resilience among children exposed to domestic violence: The role of risk and protective factors. Child Development, 80(2), 562-577.

Meyer, J. P., & Allen, N. J.(1991). A three-component conceptualization of organizational commitment. Human Resource Management Review, 1(1), 61-89.

Meyer, J. P., & Morin, A. J. S. (2016). A person-centered approach to commitment research: Theory, research, and methodology. Journal of Organizational Behavior, 37(4), 584-612.

Meyer, J. P., Stanley, L. J., & Vandenberg, R. J.(2013). A person-centered approach to the study of commitment. Human Resource Management Review, 23(2), 190-202.

Molenaar, P. C.(2004). A manifesto on psychology as idiographic science: Bringing the person back into scientific psychology, this time forever. Measurement, 2(4), 201-218.

Morin, A. J., Vandenberghe, C., Boudrias, J. S., Madore, I., Morizot, J., & Tremblay, M.(2011). Affective commitment and citizenship behaviors across multiple foci. Journal of Managerial Psychology, 26(8), 716-738.

Muthén, B., & Muthén, L. K.(2000). Integrating person-centered and variable-centered analyses: Growth mixture modeling with latent trajectory classes. Alcoholism: Clinical and experimental research, 24(6), 882-891.

Nylund, K. L., Asparouhov, T., & Muthén, B. O. (2007). Deciding on the number of classes in latent class analysis and growth mixture modeling: A Monte Carlo simulation study. Structural Equation Modeling, 14(4), 535-569.

Rand, W. M.(1971). Objective criteria for the evaluation of clustering methods. Journal of the American Statistical Association, 66(336), 846-850.

Rousseeuw, P.(1987). Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics, 20(1), 53-65.

Rupp, D. E., Skarlicki, D., & Shao, R.(2013). The psychology of corporate social responsibility and humanitarian work: A person-centric perspective. Industrial and Organizational Psychology, 6(4), 361-368.

Somers, M. J.(2010). Patterns of attachment to organizations: Commitment profiles and work outcomes. Journal of Occupational and Organizational Psychology, 83(2), 443-453.

Sterba, S. K., & Bauer, D. J.(2010). Matching method with theory in person-oriented developmental psychopathology research. Development and Psychopathology, 22(2), 239-254.

Trost, K., & El-Khouri, B. M.(2008). Mapping Swedish females- educational pathways in terms of academic competence and adjustment problems. Journal of Social Issues, 64(1), 157-174.

Vargha, A., Bergman, L. R., & Takács, S.(2016). Performing cluster analysis within a person-oriented context: Some methods for evaluating the quality of cluster solutions. Journal of Person-oriented Research, 2(1-2), 78-86.

Vargha, A., Torma, B., & Bergman, L. R.(2015). ROPstat: a general statistical package useful for conducting person-oriented analyses. Journal of Person-oriented Research, 1(1-2), 87-97.

Vermunt, J. K.(2004). Latent profile model. In M. S. Lewis-Beck, A. Bryman, & T. F. Liao (Eds. ), The sage encyclopedia of social sciences research methods (pp. 554-555). Thousand Oakes, CA: Sage Publications.

Vermunt, J. K., & Magidson, J. (2002). Latent class cluster analysis. In J. Hagenaars, & A. McCutcheon (Eds. ), Applied latent class analysis.(pp.89-106). Cambridge: Cambridge University Press.

von Eye, A., & Bogat, G. A. (2005). Logistic regression and Prediction Configural Frequency Analysis-a comparison. Psychology Science, 47(3/4), 326-341.

von Eye, A., Bogat, G. A., & Rhodes, J. E. (2006). Variable-oriented and person-oriented perspectives of analysis: The example of alcohol consumption in adolescence. Journal of Adolescence, 29(6), 981-1004.

von Eye, A., Mair, P., & Mun, E. Y.(2010). Advances in configural frequency analysis. Guilford Press.