HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

误差理论论文集锦9篇

时间:2023-03-27 16:38:24

误差理论论文

误差理论论文范文1

Liu Manping

(The Technological Higher Junior College of Aviation of Xi'an,Xi'an 710077,China)

摘要: 本文通过作者在多年的测量课程教学及测量实际工作中,遇到理论和实际问题时如何解决的体会,对应用误差理论指导导线测量进行了探讨。并对误差理论在对采点布线工作的指导、对水准测量的指导、对水平角测量的指导、对量距的指导、对坐标增量计算的指导等进行了比较深入的研究,在课程教学中得到了实际应用,取得了很好的效果。在施工现场的测量应用中也取得了成功。

Abstract: Through the experience of solving the theoretical and practical problem in the author's many years measurement course teaching and measuring work, this text discussed the application of error theory in instructing wire measurement, and carried out more in-depth study on its guidance to sampling point wiring, level measure, horizontal angle measurement, volume from, and incremental calculation of coordinates, which have get practical application in the teaching of course, and have made very good result. It has succeeded application in the measurement at the construction site too.

关键词: 误差理论 导线测量 工作指导

Key words: error theory;wire measurement;the guidance of job

中图分类号:TU19 文献标识码:A文章编号:1006-4311(2011)14-0102-02

0引言

众所周知,在测量工作中,不论使用多么精密的测量仪器,观测者多么仔细认真,外界自然条件多么适合,对某一未知量进行多次重复观测时,所测得的各次结果总是存在着差异,这就说明观测结果中不可避免地存在着测量误差,也就是说测量误差是客观存在的,是不可完全消除的。或者测量结果中存在一定的误差是合理的,是允许的。而探讨测量误差理论的主要目的就在于分析测量误差产生的原因和性质,掌握误差产生的规律,合理的处理含有误差的测量结果,求出未知量的最可靠值,正确的评定观测值的精度,研究误差理论,不是为了将误差全部都消除,因为这是不可能的。而在于用误差理论正确的指导测量的施测工作和理论计算工作,最大限度的减少误差,使得观测值更加准确,以便提高测量结果的精密度。

测量误差按其对观测结果影响的性质不同,可分为系统误差和偶然误差两大类。

系统误差的特点是误差大小,正负符号均保持不变或按一定规律变化,具有累积性,对测量结果的质量影响很大,但系统误差在施测过程中和计算过程中,可以采取相应的措施来消降,这些措施在施测过程中非常重要的,是根据系统误差理论总结出来的,是确保观测结果精度的有效途径。

偶然误差的特点时误差大小。正负符号不定,表面上没有规律可循,在施测过程中也没有办法消降。

众所周知在观测过程中,系统误差和偶然误差往往是同时存在的,而系统误差可以采用适当的观测措施和计算方法来消降,这样会是观测结果的误差主要呈现出偶然的性质。因此测量误差理论主要在于研究偶然误差理论。

单一的偶然误差没有规律可循,但当观测次数增多,偶然误差也是有规律的,且观测次数越多,规律越明显。偶然误差具有下列特性:①在一定的观测下,偶然误差的绝对值不会超过一定的限值。②绝对值较小的误差比绝对值较大的误差出现的机会多。③绝对值相等的正负误差出现的机会相同。④偶然误差的算术平均值随差观测次数的无限增加而趋近于零。

偶然误差理论是确保观测结果质量的可靠保证,是指导施测和计算的理论依据。

1导线测量任务

建筑测量集中实训往往是布设一个闭合导线,进行平面测量和高程测量。具体任务是:采点布线、水准测量、水平距离测量、水平角测量、数据整理、成果计算。

2误差理论在各项具体工作中的指导作用

笔者认为测量误差理论是非常重要的,这是因为它是施测过程和计算的指导依据,是保证观测结果质量的先决条件。渗透到测量工作的各个环节中,哪一项具体工作也离不开它的指导,因此可以这样说,测量误差理论是测量课程的理论核心,对施测工作和计算工作具有至关重要的指导意义。下面将对误差理论在导线测量过程中的指导作用作以讨论,并按四等测量的要求进行。

2.1 对采点布线工作的指导采点布线除了基本的要求外,为了最大限度的减小误差,应注意以下两点:①点与点的距离不能太长,不超过200米,这是因为四等水准测量要求视线长不能超过100米。②点与点的距离也不能太短,这是水平角测量中短边的误差比较大。

2.2 对水准测量的指导除了水准测量应注意事项外,为减小水准测量的误差,在施测和计算过程中还应注意以下几点:①测站校核。测站校核的目的有三,一是为了消除超过一定限度的粗差;二是为了取其平均值以抵偿偶然误差;三是避免误差的传递。②高差闭合差。高差闭合差必须小于容许误差,才能确保水准测量的精度。若不能满足说明结果中存在着超过一定限度的偶然误差,这是不允许的,应该重测。③平差。高差闭合差的调整最好按测段距离加权进行,这是因为水准测量误差的大小与视距的长度成正比的,而与所测高程差值大小无关。平差的目的主要是为了消除系统误差,其次是为了避免误差的传递。④计算校核。高差闭合差与高差改正数之和应该大小相等,符号相反;对闭合水准线路来说,改正后的高差之和应为零。对闭合水准线路高程推算应从起点开始,最后对回到该点,起始点到已知高程应与推算出来的高程完全相等,计算过程中步步校核的主要目的在于减少误差的传递核累积,以提高测量成果的精度。

2.3 对水平角测量的指导为了提高水平角的观测精度,在掌握了水平角测量应注意事项外,还应注意以下几点:①测量的次数和测站校核。对于四等测量来说,至少要有两个测回。这样做的目的有三,一是去除超过一定限度的粗差,二是消除了系统误差,三是取了算术平均值就可以抵偿部分偶然误差。另外也避免了误差的传递和累积,也相当于测站校核。②角度闭合差。为了保证测角的精度,角度闭合差必须小于允许误差,若不能满足,说明施测过程中或计算过程中存在着超过一定限度的粗差,这是不允许的,应重测或者重新设计。③角度闭合差平差。角度闭合差的调查有两种做法,一般是角度闭合差的调查按所测水平角的个数来均分,这是因为测角的误差与所测的角值大小无关(除对中误差,对平角的影响外)。如果所测角的个数较少,可按两条长边所夹的角少分,两条短边所夹的角多分,一长、一短两边所夹的角居中,在考虑给接近于平角的角分多分点。这是因为,测角的误差大小与边长成反比另外在相同的对中偏心差的条件下,对接近于平角的影响大。平差的主要目的有二;其一是通过计较手段(利用改正数)来消减一部分系统误差,其二是为避免误差的传递和积累。④坐标方位角的推算根据起始边的已知坐标方位推论其它各条边的坐标方位角,这里要注意的是必须用改正后,且闭合差为零的所测的内角来推论,以免误差的传递和累积。⑤计算校核。1)角度闭合差的大小应和改正数之和完全相等且符号相反。2)调整平差后到角度闭合差应等于零。3)推算出来的起始边的坐标方位角应和已知的相等。步步校核的主要目的在于避免了计算错误和误差传递。

2.4 是对量距的指导量距采用一般量距方法,具体做法是用钢尺的不同部位前、后尺各读两次数,的两组数据,两次距离之差不得超过5mm,取其算数平均值,这样做的目的在于可以避免误差和抵消部分读数误差,易于将尺段的相对误差控制在1/5000,将测段的相对误差控制在1/3000,以满足导线全长闭合差的要求。

每个测段往往都要量若干个尺段,将尺段的相对误差控制在1/5000,根据和差函数的误差传递定律:

m■=±■

可知,测段的相对误差必然大于尺段的相对误差,故将相对误差控制在1/3000。

2.5 对坐标增量计算的指导角度测量成果计算结束后,推算出了各条边的坐标方位角和象限角,校核无误,再加上符合精度要求的量距成果,就可以进行坐标增量的计算。

坐标增量可按相应公式计算,注意正负号的判别。

2.5.1 导线全长闭合差导线全长闭合差必须符合容许误差的要求,以利于提高测量结果的精度,根据坐标增量计算公式可知,坐标计算误差主要来源于两个方面,其一是来自于测角的误差,其二是来自于量距的误差,根据一般函数的误差传播定律:

M■=±■

可知,导线全长闭合差必然会大于量距的相对误差,因此四等导线全长闭合差定为1/2000。

2.5.2 坐标增量闭合差的调整坐标增量闭合差的调整的原则是按边长加权进行调整,也就是长边多少,短边多少,而测角误差无关,这与坐标增量的两个误差来源于是相悖,这是为什么呢?这是因为测角误差在角度成果计算过程中通过平差将大部分系统误差已消降,而量距误差无法进行平差计算故其仍然存在,且产生影响也大,因此在坐标增量闭合差调整过程中,主要考虑量距误差的影响。

2.5.3 校核计算①X轴上的坐标增加闭合差应与其改正数大小相等、符号相反Y轴也一样。②改正后的坐标增量闭合差无论是X轴还是Y轴,必须等于零。那么导线全长闭合差也必然等于零。③推算出已知点的坐标值必须与已知的坐标完全相等。

校核计算的主要目的在于避免误差的传递和累积,同时也避免了计算错误,提高了测量结果的精密度。

3结论

由以上分析可知:误差理论指导着测量工作的各个环节,指导着每一项具体的工作。可以说测量工作每一步都离不开误差理论的指导。误差理论的指导决定着观测结果的质量,关系到观测数据的可靠性。这与误差理论的来源是密不可分的,误差理论是从实践中来,在理论上得到升华后,再来指导实践。所以误差理论具有非常实际的、重要的指导意义。

掌握好了误差理论,不但能在实际工程中做好测量工作,而且在实际工作中,可以举一反三,在误差理论的指导下,进一步的完善、创新施测工作。并为今后的工作奠定了良好的理论基础。

参考文献:

[1]刘满平主编.建筑工程测量.北京:中国建材出版社,2010.

[2]王元江,赵西安主编.工程测量,北京:建工出版社,2004.

[3]王景峰主编.工程测量.北京:人民交通出版社,2007.

[4]李青岳主编.工程测量学.北京:测绘出版社,1995.

[5]王箫礼主编.测量学.上海:同济大学出版社,1990.

[6]催吉福主编.工程测量.北京:建工出版社,2005.

[7]张正禄主编.工程测量学.武汉:武汉大学出版社,2002.

[8]章书寿主编.工程测量学.北京:水利水电出版社,1994.

[9]张保成主编,测量学实习指导与习题.北京:人民交通出版社,1999.

误差理论论文范文2

【关键词】浮点数 舍入误差 矩阵运算 误差界

一、引言

在计算机中实数要表示为浮点数的形式,但是由于计算机浮点数中尾数的位数是有限的,在计算的时候,对一般实数必须要按舍入原则表示为浮点数。这样, 计算机浮点数就是该实数的近似值。因此,我们通过讨论代数运算引起的误差界进而给出求解线性方程组的近似算法的误差界。

二、实数计算机浮点表示方法[1]

计算机中的浮点数可表示为

这里是机器所用浮点数的基底,是阶数,是尾数,尾数一般可表示为

其中是尾数位数,称为字长, 若,则称该浮点数为规格化浮点数。若用表示一个系统的浮点数的全体所构成的集合,则

显然,集合是一个对称地分布在区间中的有限数集,其中,

因为是一个有限集,所以它就不可能将中任意实数表示出来。以下我们来讨论对于一个给定的实数,应选择什么样的浮点数去表示它,由此产生的相对误差又是多少。

三、浮点数的误差界估计

实数表示成浮点数之后,我们即可得到它的相对误差限,这是进行误差分析的基础,由参考文献[2]得误差分析的基本定理如下:

四、算术运算的舍入误差分析

用来表示加、减、乘、除四则运算中任意一种运算。对给定的数,,在运算中, 若是上溢;若是下溢。以下在不发生溢出的情况下进行讨论,则由参考文献[2]知:定理3.1 ,,同上(6)式(8)

五、矩阵基本运算的舍入误差[4]

首先,我们引进记号,

并规定 当且仅当 ,

(一)向前误差分析法

设是由中的元素构成的矩阵且是用浮点数表示的实数,所以有

注释:上述的这个三个矩阵基本运算的舍入误差界,是估计了计算解与精确解之间的误差,舍入误差的界与精确解有关。这种误差分析的方法称为向前误差分析法。

(二)向后误差分析法。

假定上面所述的矩阵是的上三角矩阵。则由定理3.1可知

注释:向后误差分析法的优点在于,它将浮点数的运算化为实数的精确运算,从而在分析过程中就可以毫无困难地使用实数的代数运算法则。

参考文献:

[1]唐珍. 舍入误差分析引论[D]. 上海: 上海科技出版社, 1987;

[2]刘永汉;多维基r()FFT 舍入误差的分析[J];自然杂志;1986年05期;

[3]曹志浩, 张玉德, 李瑞遐. 矩阵计算和方程求根[M ] .北京: 高等教育出版社, 1984.

作者简介:

误差理论论文范文3

关键词:院校研究;问卷调查;数据;质量;调查总误差理论

中图分类号:G647 文献标识码:A 文章编号:1672-0059(2013)02-0046-08

院校研究(IR)涉及三个数据源:院校信息系统或管理数据(如注册学生数据、教师数据);外部数据源(区域或国家的数据,如美国的高等教育综合数据系统);从各种问卷调查和查询收集的数据。所使用的问卷调查常常是本地开发的。尽管本地制备的调查可能是获取所需信息的最佳选择,但是高校中的信息用户通常更加信任源于管理数据的研究,而不是那么信任源于调查数据的研究。在高等教育研究者和政策制定者中也发现类似情况,他们一贯对更软性、更主观的测量手段(如基于认知的调查数据)缺乏信心。同时,内、外部评估的需求比以往任何时候都对调查数据质量提出了更高的要求。此外,人们对常用的大学生调查的有效性提出了质疑,呼求更加严谨的调查设计和评估方式。在此情况下,需大力提高高等教育研究和院校研究的调查数据质量,以提高对调查数据的接受和使用程度。

可惜的是,以院校研究人员为目的、从整体上考察调查数据质量问题的文献十分有限。现有的改进调查方法的努力中存在两个空缺。首先,虽然从各方面论及调查项目的文献很多,但是缺乏有效的文献汇总,也缺乏以质量控制为目标的思维模型。由于缺乏综合,调查方法论问题尚未从质量的视角加以考察。由于调查质量是个多层面的复杂问题,这种缺乏思维模型和信息综合的情况是可以理解的。当深入研究一个特定领域时,就很难从广度上覆盖该主题的其他领域。然而,如果研究员严肃地对待调查数据质量,这种知识综合对任何形式的调查项目,无论是像全国学生参与度调查(NSSE)这样的多院校调查,还是单个院校内部的调查,都是必要的。

与之相关的第二个空缺是,在院校研究领域缺乏一个有关调查误差的综合思维模型。虽然“认真的”IR人员在努力提高调查数据质量,但他们往往不依赖任何调查方法理论。后文描述的一个调查方法理论——调查总误差——是一个非常有用的解决调查数据质量问题的方法。然而,目前的IR文献很少涉及调查总误差理论及其在IR中的应用。虽然有一些出版物从调查误差的角度,已经触及IR领域的调查问题,但对数据质量的论述仍然有限。因此,从数据质量的角度,透过调查总误差理论来看待IR的调查问题颇具意义。它提供了一个优化调查的理论框架,并为调查方法论提供了一个中心组织架构。本文后面的讨论均是基于这一观点,目的是将调查总误差的方法论融入到IR的数据质量问题里来。

院校研究人员为改善数据质量所付出的努力是不均衡的。这也使得提高调查数据质量的任务更为紧迫。在IR领域举足轻重的著作《人员、过程和管理数据》对IR如何为高校提供信息支持加以阐释。书中的信息支持周期包括五个信息管理阶段和以下三个利益相关方:保管人,供应者(负责数据的完整性);中间人/生产者(将数据转化为信息);管理者/用户(接纳信息并实地应用)。该周期的中心是质量决策(图1)。虽然IR与数据保管人和用户也相关,但其职能主要与信息中间人的角色相一致(第17页)。然而,该书仅讨论了IR的一个数据源,即院校管理数据,而没有论及问卷调查研究项目产生的数据。因此,当涉及调查数据时,IR职能如何融入信息支持周期,尚不清楚。

因此,本文基于调查总误差理论,为院校研究提出一项调查数据质量策略。下面我将简要介绍调查过程的质量视角和调查总误差的主要组成部分。随后,我将所提出的调查数据质量策略总结在一份表格中,并加以解释。本文以讨论该策略对IR的启示结束。应当说明的是,本文关注的是IR调查数据质量问题的整体概览和宽度,重点不在每个问题的深度。对某个特定主题感兴趣的读者,请查阅针对单个问题的文章获取详情。

一、调查过程的质量视角和调查总误差

问卷调查,可以通过两个视角考察。一个视角是过程视角:调查者检查一个调查项目所需的一切步骤和决定,这包括在信息需求基础上确定研究目标、确定抽样方法、开发调查工具、开展调查、进行数据分析以及最终生成调查报告。这个视角把调查过程描述为一个连续但有重叠的过程。

调查过程的第二个视角是质量视角。这种方式并不专注于如何最好地实现调查过程的每一步,而是关注于每一步会发生什么问题,以及如何克服或使其发生概率降到最小。换言之,它旨在检查调查过程中可能发生的误差,以最大限度减少这些误差,从而提高调查数据质量。因此,质量视角与调查误差相关,也正是在此,引入调查总误差的概念。最佳调查设计的目标可以简单地表述为“使受成本和时间所限的调查总误差最小化”。

图2对调查过程的质量视角和过程视角进行了比较。调查过程的质量视角由测量路径和代表路径组成。两个路径都是从抽象到具体:测量路径从构念开始,而代表路径始于目标总体;随着过程视角下调查项目始于信息需求,继而到数据处理,再到报告生成,测量路径和代表路径也向下移动,并会合于获得调查统计数据。

调查总误差是指“目标总体的均值、总和或其他参数与抽样调查(或普查)的参数估计值之间的差别”。调查误差可以有不同的分类。有人将其分为抽样误差和非抽样误差;还有人将其分为测量过程的观测误差(始于构念,终于编辑应答)和代表过程的非观测误差(始于目标总体,终于调查后调整)。不论调查误差如何分类,调查总误差包含以下五类:测量误差、涵盖误差、抽样误差、无回答误差和调查后(即数据处理或调整)误差。这些类型的误差如图2所示,并在后文详述。

每一种调查误差都会产生可变误差(variableerror)和系统误差(systematic error)的风险,这些风险会分别导致误差差异(error variance)和偏误(bias)。误差差异和误差偏误是衡量数据质量的两项标准,差异比偏误更容易测量和控制。表l列出了五种调查误差产生可变误差和系统误差的风险高低。

在一般的调查项目中,抽样误差产生系统误差的风险较低,而其他四种调查误差产生系统风险的可能性较高。这是因为,如果调查采用了合理的抽样方法,抽样误差产生系统误差的风险相当小,而可变误差的风险是不可避免的。相比之下,由于问卷设计欠佳,所导致的测量误差会产生较高的系统误差风险。一个组群可能完全没有被包含在抽样框中,使得涵盖误差产生较高的系统误差风险。

在一个典型的IR调查项目中,目标总体一般为院校学生或教职员工,即有限总体。抽样框通常可以从学生信息系统或人力资源数据库中获取,这个优势减少了涵盖误差产生系统误差的风险。目标总体通常使用电子邮件和在线资源,这为对大学生或教职人员进行网络调查创造了比对校园外人群进行调查更加便利的条件,也使网络调查成为高校常用的调查模式。此外,高校通常拥有较先进的数据输人和处理资源(如软件和研究的专业知识),这会有助于减少数据处理误差。鉴于这些特性,每一种调查误差产生可变误差和系统误差的风险高低,会不同于其他背景下的调查项目。表1显示了IR调查项目中,五种调查误差所产生的可变误差和系统误差的风险指示。

二、调查数据质量策略

本文的调查数据质量策略是在调查的质量保证(quality assurance)和质量控制框架中提出的,并针对上述五种调查误差。

质量保证和质量控制两个概念之间有细微的差别:“质量保证确保过程能够提供良好的产品,而质量控制确保产品确实是优质的”。因此,质量保证与调查过程相关,而质量控制与调查产品有关。调查研究人员同时追求过程质量和产品质量。调查质量通过可靠的过程(过程质量)得到保证,而这些过程导致良好的产品特性(产品质量)。根据这个框架,为了实现质量控制,需要对高质量调查数据(即产品)的特点作出定义;而为了实现质量保证,应确定高质量调查过程的特点。

基于这些考虑因素,本文提出的调查数据质量策略包括三个组成部分:质量标准,这是高质量调查数据的特征或指标;质量控制程序,用来检查调查的各个方面和数据是否具有质量标准中规定的品质特点;质量保证程序,用于检查调查过程是否实施了一定程序,以确保得到的调查数据集具有质量标准中规定的高质量调查数据的特点。

调查数据质量策略总结在表2中,五种调查误差为行,三个方面的质量检查为列。该策略与两种处理调查误差问题的方法(即误差测量和误差减少)相吻合。质量控制程序以测量和评估调查误差为目标,而质量保证程序的目的是减少调查误差。

以下部分中,我将分别阐述五种调查误差的质量标准,以及在IR背景下其相应的质量控制和质量保证程序。表2为这些标准及相应程序的总结。

三、测量误差的质量检查

测量误差是所得回答与被测量物之间的差别。参照图2,测量误差代表构念和测量之间的差距,以及测量和回答之间的差距;这些差距会在工具设计和数据收集的过程中发生。与测量误差相关的高质量调查数据有三个指标:合理的效度;合理的信度;回答偏误降低到最低。

1、质量控制程序

效度作为测量的必要条件,指调查测量在多大程度上真实地反映了预期构念④。效度评估主要被视作相关性检查⑤。构念效度(construct validity)包括内容效度和标准相关效度,是在考虑效度时总揽其它效度的概念。如果测量与其背后的理论概念一致,那么数据就具有构念效度。构念效度有两个衡量指标:会聚效度(由调查回答与其他调查中类似问题的回答之间的正相关性来测量)和区分效度(由调查回答与对测量不同构念问题的回答之间的低相关性来测量)。因子分析是检验构念效度的有用统计方法。

信度“测量在理论上反复试验的过程中回答的变异性”。涉及回答者的回答是否稳定一致,因此也被称为回答差异(response variance)。信度常以两个调查估计值的相关性来计算。回答的信度有三种评估方式:内部一致性(通常用克隆巴赫系数测量)、分半信度和重测信度(通常都用斯皮尔曼一布朗系数计算)。对于定性回答,也可用交互评分者信度来评估。

回答偏误是样本估计值与目标总体真值之间的系统性偏差或差别;换言之,受访者的平均回答始终高于或低于目标总体真实的平均值。引起回答偏误的来源有情绪、社会可取度、语言困难、极端回答和一味肯定等。

有两种方法来评估回答偏误。一种是将调查数据与调查以外的数据或信息进行比较。例如,向该调查项目的利益相关者或负责人核实,考察调查结果是否与他们的经验或知识一致。另一种评估方法是评估某种回答倾向的发生情况,如有些受访者以社会所认可的方式回答,避免使用评定量表中的极端回答类别,或对所有题项给予相同的答案(即强满意现象)。

2、质量保证程序

可以用以下方法减少测量误差。首先,研究员应将调查基于稳固的理论或概念框架,力求设计出高品质的提问措辞和问卷结构。由于IR调查项目常出于院校的某种需要,调查的构念往往主要根据经验,而较少基于文献中的概念框架。然而,尽管IR项目应用性较强,文献查阅也应是调查设计过程的一部分。

第二,应该进行认知访谈,以确保目标总体以问卷所预期的方式理解其中的问题。第三,受访者充分的回答行为与认知过程的优化完成和足够的动机有关;因此,问卷的设计和执行应确保参与者在回答调查问题时确实经历了心智处理的四个组成部分,即理解、检索、判断和回答。未这样做的一种情况是强满意(strong satisficing),发生于回答者跳过检索和判断步骤便作回答。对此,可以询问受访者是如何完成问卷的,让他们自我评估在回答问卷时自己的动机和能力如何。

第四,对于访谈式调查,调查程序应确保足够的访谈行为。访谈行为可用访谈者差异测量,最好用多层次分析法加以分析。

四、涵盖误差的质量检查

参照图2,涵盖误差发生于抽样框和目标总体之间存在差别时。高质量调查数据的特点是使抽样框和目标总体之间的差值最小化。

1、质量控制程序

目标总体中的一部分在抽样框中不存在或无法获取时,偏误就会发生。Groves等人认为,造成这种情况的原因有:目标总体中的某些元素没有或无法出现在抽样框中(即未涵盖),抽样框中的某些单位不在目标总体中(即不合格的单位),框中若干单位对应目标总体中同样的单位(即重复)。研究人员应该检查这些情况。

另一个评估抽样框与目标总体之间差别的程序是,比较目标总体的规格与抽样框的相应参数。由于高校通常在新生入学时配给他们学校电子邮件地址,涵盖误差不像其他领域,对于IR网络调查来说不是大的威胁。

2、质量保证程序

研究人员需要确定目标总体的工作定义,明确目标总体的规格,找到一个可以随即使用的、尽可能多包含目标总体的列表。IR背景下,典型的目标总体是具有某些特征的学生群体,如申请人学的未来新生,或目前就读某个专业的在读生,或在某个时间段内毕业的毕业生等。高校通常有较为完善的学生数据库,因此,抽样框往往是稳定的、完整的、可获取的。因此,涵盖误差产生可变误差和系统误差的风险通常较低,且更可控。

五、抽样误差的质量检查

抽样误差指由抽样造成的调查估计值与目标总体参数之间的差别。参照图2,抽样误差表示抽样框和样本之间的差距。一套好的调查数据在已知人口参数上是代表抽样框的。当使用概率抽样时,边际误差常被用于测量随机抽样误差水平。通常可接受的边际误差是在95%置信水平下小于5%。

1、质量控制程序

样本代表性可通过比较所得样本和抽样框在某些背景特征上的频度分布来确定。若频度分布差别可以忽略,则认为所得样本在这些指标上代表抽样框。

边际误差受方差和样本量的影响:方差越小,样本量越大,边际误差越小。我们需要知道总体标准差以便估计等距变量或比率变量均值的边际误差。IR调查项目通常采用有限总体,变量的边际误差可以基于目标总体和样本量来计算。

2、质量保证程序

抽样误差大小比其他类型的调查误差更为可控,故被称为有意误差(intentional error)。抽样误差可以通过适宜的选样得到控制,确保对抽样框随机选择,以及总体中关键子群在样本中具有充分的代表性。适当的抽样过程要求考虑概率抽样、分层、聚类和样本量四个方面。抽样偏误可以通过给所有元素平等的选择机会而轻而易举地去除;当样本量大且样本是分层而不是聚类时,可以减少抽样差异。

适当的抽样策略涉及合理样本量的计算。样本量由抽样框、期望的边际误差、预期回答率、数据分解需要和可用资源来确定。表3显示了一个例子。请注意,表中呈现的边际误差是按二分变量使用最大方差(即标准差等于0,5)计算的。

对于10,000名学生的抽样框而言,如果研究员期望所获得的边际误差低于5%,则需要的样本量是400(边际误差为4,8%)。如果预期回答率为20%,则预计共需邀请2000名学生参与调查。若数据分析要求将这400个样本分为子组,比如对于一所由8个学院组成的大学而言,则每个子组中有50名回答者。这个回答者数量对于描述性统计分析是可以接受的。但是,如果打算进行统计推断分析或多变量数据分析,考虑增加样本量到800(这个数量取决于调查需要解决的问题),在预期回答率仍保持20%的情况下,则边际误差为3,32%,样本量为4000。如果调查以网络模式进行,调查受邀者增多也无妨,因为更大的规模不会使调查总成本过多增加。但是,当使用邮件调查,来自调查问卷的分发和数据的输入、处理的成本增加将是确定样本量的一个考虑因素。研究员应平衡所有这些考虑因素。

六、无回答误差的质量检查

对照图2,无回答误差表示样本和回答者之间的差距。此误差的发生,是由于样本中的部分受邀者没有应答调查邀请,或没有回答调查中的一些问题。因此,无回答误差有两种:单位水平的无回答和题项水平的无回答。当调查数据与整个样本数据之间在某些重要特征上有系统性差别时,就会产生无回答偏误。

1、单位无回答的质量控制程序

测量无回答偏误是无回答率以及回答者与无回答者之间差值的函数计算。由于无回答率是没有回答调查的样本在合格受邀者中的比例,无回答率可以根据回答率计算而得。因此,高质量的调查数据以合理的回答率以及回答者与无回答者之间在调查所关心的特征上差别不显著为特点。

计算回答率的难点通常在于对其分母的计算。IR调查项目的抽样框是从明确定义的目标总体中仔细提取的,其回答率的计算主要有两种方式:一种是c/(C+NC+R+O),C=完成的问卷,NC=未联系上,R=拒绝回答,O=其他未回答(如由于语言障碍无法理解问题的人);另一种是简单的c/(S-NC),c=完成的问卷,s=抽样调查接收者,NC=未联系上。这两个公式表明,被抽样的调查接收者实际上由调查回答者和三组未回答者(即未联系上、拒绝回答和其他类型的未回答者)组成。

回答者和未回答者之间的差别可以用三种方法来评估。首先,评估未回答者与调查主题间的交互程度。通常对调查主题参与程度高的人比不参与的人更可能回答调查,而那些对调查主题意见中立或经验较少的人倾向于忽略问卷。例如,在针对大学生如何使用图书馆的调查中,研究员应切记,得到的回答将过度代表图书馆实际使用用户的特点,因为那些使用图书馆服务的学生更容易回答这项调查。因此,若从这些数据得出关于所有学生图书馆使用情况的结论,是错误的。第二,将回答者与抽样框在背景特征上进行比较,并考察回答者中是否存在不充分代表抽样框子群,以及未被充分代表的子群成员是否倾向于以不同的方式回答某些关键的调查问题。第三,考察后期回答者的特点。那些直到最后跟进才回答的人可能与未回答者具有相似特征,因此,从后期回答者的回答中可以对未回答者的回答进行推断。

2、题项无回答的质量控制程序

与单位无回答误差相似,题项无回答误差是题项无回答率以及题项回答者与无回答者之间差别的函数。题项无回答导致数据缺失。因此,在题项水平上,高质量调查数据有两个特征:每个题项的缺失数据所占比例合理;每个题项回答者与无回答者之间的差别不显著。

上述两个方面涉及题项无回答分析。应对存在较大比例数据缺失的题项做标注,并做进一步调查。题项无回答分析包括检查:(a)无回答的发生是否与受访者的某些背景特征相关,或者说,某个受访子群对关键问题的回答是否与其他人不同;(b)不同题项的无回答是否具有相关性。

题项无回答分析可在三个方面进行:(a)计算每个题项缺失数据的比例;(b)确定缺失数据的特征是完全随机缺失,还是随机缺失,或是不随机缺失;(c)调查有大比例缺失数据变量出现的原因。

3、无回答的质量保证程序

质量保证程序产生于三种类型的单位无回答:未联系上、拒绝回答和无法参加。第三种类型的单位无回答情况也适用于题项无回答,即某些受邀者不能够回答一些问题,他们或觉得有些问题很难理解,或不记得被提问的信息,或问题超出他们的回答能力。调查无回答的现象越来越多,很多是调查拒绝率上升造成的。当前IR调查项目的一个问题是,调查数目多,在受访者中产生调查疲劳。

无回答的原因可能为社会环境(如调查疲劳),与受访者的背景特征有关(如男生会比女生回答调查请求的可能性低),也与问卷设计和调查实施方式有关。与调查设计相关的因素比社会或个人因素更为可控。

从调查设计的角度减少三种类型的调查无回答是有不少办法的。针对联系不上被访者的情况,可以尽力获取被访者准确的联系信息;使用网络调查时,创建不会被过滤器标记为垃圾邮件的电子邮件信息。针对拒绝回答的有效方法有:在调查之前通知被访者;撰写礼貌的初次接触信函(信件或电子邮件);注意要求参与调查的方式(如语气、签名、调查的重要性和保密性等)、合理的提醒次数、适当的数据收集时机和适当的鼓励机制。为了提高被访者的参与能力,调查工具应长度适宜、容易阅读,提问有相关性的、可获取的信息。创造有助于调查的环境也将有利于增加回答。如果调查协调机制到位,调查疲劳可以得到缓解;当了解到调查结果已被采用时,被访者一般会更可能作出回答。

七、调查后误差的质量检查

可靠的研究结果和有效的结论取决于对个体数据和聚合数据的正确处理。调查后误差指在调查数据收集之后的数据处理过程中发生的误差。在这个过程中,原始数据转化为由调查统计数据所代表的信息。如图2所示,调查后误差发生的时间段有三种:测量路径上的回答变成被编辑的回答时;代表路径上对回答者作出调整时;将被编辑或被调整的回答转换成统计数据时。

1、质量控制和保证程序

数据收集后的数据处理可分为数据清理、数据调整和数据分析三种。数据清理包括检查数据录入的准确度以及检查异常值和有矛盾的数据。数据调整包括使用权重,处理缺失数据,并在需要时创建复合变量。数据分析包括信度、效度分析,检查统计假设,选择适当的统计方法,进行统计计算。使用开放式问题时,需要对回答进行编码,这涉及检查编码者差异和编码结构中的不足。对数据清理、数据调整和数据分析的准确性和恰当性进行量化通常很难,和其他类型的调查误差不同,所有这些步骤都受到研究员的控制。因此,每个程序是否正确、适当很大程度上依赖于研究员的专业知识和职业风范(如数据处理时的勤奋严谨、一丝不苟和坚持不懈)。然而,为了实现质量控制,应对数据的清理、调整和分析程序作详细记录,从而为数据处理的质量方面提供证据。

八、启示

本文提出的调查数据质量战略对IR有两个实用的启示。首先,调查数据的质量需用多个指标衡量。调查数据的质量是多方面的,这意味着依靠单一指标来评估调查数据是具有误导性的。人们对回答率的盲信就是个很好的例子。IR人员有时会听到信息用户这样评论:“这样低的回答率,调查结果必有问题”;“回答率高,因而调查数据很好地代表了总体”。

调查数据质量策略的标准和程序(见表2)表明,高回答率虽然非常重要,但它仅是高质量调查数据的一个指标。为评估单位无回答误差,研究员还需考虑所关心的特征上回答与无回答之间是否存在区别。评估一套调查数据的质量时,除了回答率,还应考虑从其他调查误差得出的质量指标,包括会影响到测量误差的回答偏误以及测量抽样误差的样本代表性和边际误差。另外,回答率并不说明调查回答具有代表性,代表性是无回答偏误的另一个指标。因此,较高的回答率会降低产生无回答偏误的风险;然而,如果未回答者在某个调查变量上与众不同的话,高回答率并不一定导致调查数据无回答偏误低的结论。因此,本文提出的数据质量策略有助于破除一些有关调查数据质量的盲信,且鼓励研究员检查其他质量指标,而非仅仅注重如回答率这样的一个指标。

第二,记录调查数据质量的重要性。调查数据质量策略使得质量记录更加重要。该策略基于调查总误差理论,从调查误差类型出发,包含针对每类调查误差的质量标准及相应的质量控制和质量保证程序。表2为获得调查数据的质量证据以及收集这些证据的程序提供了纲要。因此,归根结底,IR研究员的任务是,从所获得调查数据的特征以及调查过程中搜集证据,使信息用户信服所采集的调查数据对于做出的结论是可靠的。搜集、呈列的证据越多,越能赢得信息用户的信任。这一证据收集过程需要记录。

关于调查数据质量证据的信息被称为元数据(即关于数据的数据)。可以用以下四种类型的元数据来记录调查数据的质量:定义类元数据(调查结构、目标总体、抽样框、编码术语);程序类元数据(数据收集程序);操作类元数据(数据清理、数据调整以及数据分析程序);系统类元数据(数据格式、文件位置、检索协议和编码本)。

调查记录的目的是沟通调查数据的特征及获得质量指标的程序,从而建立并加强信息用户对调查结果的信任,并且帮助他们以适当的方式解读调查结果。根据表2中调查数据质量策略中的要素,我为IR研究员设计了一份核查列单(见附录),以方便他们的调查记录。

九、总结性思考

本文基于调查总误差理论为高校院校研究提出一套调查数据质量策略。该策略包括数据质量的指标(即质量标准),以及以测量和减少误差为目标、用于检查调查数据和调查过程的程序(即质量控制和质量保证程序)。表2对该策略作了总结,策略的组成部分在文中分别得到了阐述,附录为IR研究员提供了一份核查单。

有关调查数据质量问题我有两个总结性思考。一个是调查数据质量与调查质量的关系问题。Lyberg和Biemer将调查质量概述为三个层次:产品质量(“令主要用户满意的一组产品特性”)、过程质量(“设计完好和严格控制的过程”)和组织质量(“可靠的组织特征,以确保该组织有能力开发出能够提供高品质产品的可靠过程”)。这三个层次是相互依存的(即组织质量为过程质量所需,过程质量为产品质量所需),并均有助于高质量的决策。

调查数据质量,实际上是调查产品质量的一部分,并“通过过程质量实现”。调查数据质量策略主要涉及调查质量三个层次中的两个,即产品质量和过程质量。组织质量与组织文化和信息管理相关,涉及调查数据质量的信息基础设施,不在本文的讨论范围中。

另一个思考是关于调查数据质量在McLaughlin和Howard提出的IR信息支持周期中的位置(见图1)。当本文提出的调查数据质量策略融入信息支持周期,实际上IR人员在这个周期中承担了大部分责任,即保管人和中间人的责任,并执行信息支持周期中的较大比例的工作,即从确定概念到报告的过程(尽管这是与管理者一起完成的)。相比之下,在使用管理数据时,IR人员通常不会参与数据的收集和存储阶段。因此,在调查项目中,研究者的角色在信息支持周期中更为重要。这也是对调查数据质量问题作进一步研究的又一个原因:进一步提高调查数据质量,以便更好地履行IR的信息支持职能。

关注细节和质量控制体现了IR人员和IR行业的有效性。在此背景下,本文希望对填补院校研究调查质量控制方面的空白做出贡献。

附录

IR调查项目调查数据质量核查列单

检查测量误差:

*调查工具的构念是否遵循了严格的设计流程?进行过认知访谈吗?

*是否有证据显示调查数据的信度?

*是否有证据显示调查数据的效度?

*回答的发生有何特点或趋势?

检查涵盖误差:

*明确定义了目标总体的规格吗?

*抽样框尽可能多地包括了目标总体的要素吗?抽样框的参数与目标总体的规格一致吗?

*抽样框中存在未涵盖、不合格单位或重复单位的问题吗?

检查抽样误差:

*样本量合理吗?(期望获得多少受访者?期望的边际误差是多少?预期回答率如何?)

*使用了什么抽样方法?方法合适吗?样本的入选几率平等吗?(如果使用分层抽样)哪些子群的入选几率不平等?

*基于这样的受访者数目和目标总体数目,边际误差是多少?获得的边际误差合理吗?

检查无回答误差:

*回答率合理吗?

*关于调查的主题,哪些样本会更有可能回答调查?哪些样本不太可能回答呢?

*受访者与目标总体(或抽样框)在某些背景特征上差距有多大?

*重要的样本子群在回答者中的代表性如何?

*在调查问卷的设计和(或)调查管理上是否存在任何缺陷,可能导致了一些调查者没有回答呢?

*存在大比例数据缺失的题项吗?原因可能是什么?缺失的数据报告了吗?

检查调查后误差:

*数据是如何清理的?程序恰当吗?

*是如何给数据编码的?程序恰当吗?

*(酌情考虑)是如何给数据加权计算的?方法正确吗?

误差理论论文范文4

[关键词] 调查员方差 偏移 响应误差

一、引言

非抽样误差是指统计调查中,除抽样误差以外,由于各种原因而引起的误差。它不仅存在于概率抽样,也存在于其他非概率抽样与非全面调查以至全面调查,对调查结果的影响非常大。国外众多实证研究都表明,非抽样误差在统计调查总误差中所占比重远远超过抽样误差所占比重,因而受到统计调查理论研究者和实际工作者的高度重视。由调查员引起的调查误差是国外在非抽样误差研究中一个长盛不衰的主题。外文中一般将此误差称为调查员方差(Interviewer Variance,以下简称IRV),它是指一个调查变量的总方差中可以归因于调查员的部分。

国外对调查员的研究已是汗牛充栋,但在国内还没有专门研究调查员的文献。笔者认为,造成这种尴尬局面的原因有两点:一是我国基层调查经费不足,还不具备公开选拔和全面培训调查员的物质条件。尽管在我国现行的一些调查中,尤其是不少专项调查中,也非常注重调查员的选取和培训。但在很多常规调查中,调查员的选取则很不科学。调查员往往由居委会、街道办的工作人员、退休教师、下岗工人等担任。二是我们对统计调查的重视程度还不高。无论是统计实务部门,还是研究机构,还没有充分认识到深入研究调查员行为对提高调查质量的重要性。理论研究也没有提出相应的支持依据。因而,全面深入研究调查员方差的产生根源与测定方法,才能更好地从调查员的角度降低非抽样误差。

二、调查员方差的存在性

首先,我们要简单界定一下“偏倚”的含义。Hansen等(1951)认为,影响相应误差的因素可以分为两类:一类是本质的、必然的因素。如,调查员的素质,调查员的选取方法、报酬及培训,调查项目受资助情况等;另一类是随机因素。如调查员提问问题的方式,调查对象接受调查时的心情,调查对象对调查问题的理解程度等。相应地,响应误差也包括两个部分,一个是必然产生的,另一类是随机产生的。响应误差的期望值,以及围绕此期望值波动的随机成份 都可以看做是由影响响应误差的本质因素决定的。这样,响应误差就会或多或少地表现出一些系统性的特征,这就产生了“响应偏移”。目前,关于“响应偏移”至少有两种理解。一是指由于某个调查员引起的非随机的响应误差;二是指所有响应误差对样本均值的累积影响。一般我们将“响应偏移”理解为第二种意思。即,调查中的响应误差使样本均值和总体均值产生差异,“响应偏移”表示了这种差异的程度。

目前的文献中,有少部分是从理论角度探讨调查员方差存在性的。当存在多个调查员时,为什么某个调查员的子样本均值会与多个调查员的所有子样本的样本均值存在差异呢?Hansen等(1951)利用模型证明,除非随机地分配给每个调查员一个调查个体,否则,调查员对不同调查对象的影响是相关的。由于在实际调查中,一个调查员往往要对一定数量的调查对象进行调查并记录调查结果,因而由某一个调查员引起的不同调查对象之间的调查误差是正相关的。这就说明,当存在多个调查员时,调查员方差是存在的。Freeman等(1976)从调查员所调查子样本均值围绕样本均值波动的程度讨论了调查员方差的存在性。一种情况是响应误差在每个调查员所调查子样本中随机出现,那么子样本均值将在一定程度上围绕样本均值波动且服从正态分布;另一种情况是响应误差在每个子样本中的出现是非随机的,但样本均值无偏,此时子样本均值围绕样本均值的波动将比第一种情况更加剧烈。两种情况的直观表现就是子样本均值的波动。如果每个调查员的调查子样本是可比的,如每个调查员调查的子样本是随机分配的,那么,利用方差分析就可以证明诸子样本均值之间的差异是否显著。如果诸子样本均值波动剧烈,在统计上是显著的而非偶然的,那就可以说明是响应误差引起了这种差异。如果承认调查员对响应误差存在影响,也就说明了调查员方差的存在性。

另外,更多的文献是从实证角度探讨调查员方差的存在性。Hanson和Marks(1958)、美国人口普查局(1960)利用普查数据进行了验证。Mahalanobis(1946)、Stock等(1951)、Feldman等(1951)、Gray(1956)、Franzen等(1956)、Gales等(1957)、Kish(1962)等,都用不同方法利用抽样调查数据对此问题进行了研究。实证结果表明,无论是普查,还是抽样调查,调查员方差都是存在的。相对来讲,研究抽样调查中调查员方差的文献要多一些。

三、调查员方差的来源

几十年来,国外学者,尤其是英国、美国和印度的学者都对调查员何以会影响调查结果,调查员方差产生的原因及降低措施等进行了广泛的理论和试验研究。限于篇幅,本文仅综述其中研究比较集中的一些因素。

1.调查员的人际交往能力。这是调查文献中研究比较集中的一个问题。我们可能会猜想,调查员人际交往能力越强,其调查结果的误差就会越小。但Richardson等(1965)的研究表明,调查员的人际关系技巧和分析技巧与调查误差不相关。调查员的人际关系技巧可以帮助调查员获取调查对象的信任从而接受调查,但不会对调查结果产生影响。对此,Williams(1968)有更精确的讨论。而Cahalan(1968)的研究也表明调查员的人际交往能力和调查误差之间关系很弱,人际关系可能增加也可能降低调查误差。例如,一个具有较好的社交技巧的调查员有可能更好地获得调查对象的信任和配合,但同时也可能对调查结果产生更大的影响。

2.调查员的解释能力。没有文献专门研究调查员的解释对调查结果的影响,但它确是调查员方差产生的重要原因。在很多调查中调查员也是信息解释员。当问题比较模糊,或者要获取的信息是调查对象很少想到的,这时就需要调查员的解释。类似地,调查员经常需要解释调查记录以方便对调查结果的归类。当数据需要编码录入时,也需要解释调查结果。如果一个调查是有组织的,对调查结果的解释会出现两次:在调查过程中当调查员决定如何提问和决定记录什么内容时,以及在编码员要将记录的调查结果转化成机读形式时。当解释发生时,就很有可能引起误差。就是说,调查员可能在其误差的方向和强度方面存在差异。如果调查员对某一问题有特别的倾向,那么调查员本身的差异就会增加其对调查结果的影响,其后果就是调查员方差的增加。

3.调查内容。Kish(1962),Hanson和Marks(1958)研究了调查内容引起调查员方差的可能性。他们的结果表明当利用无效回答和其它回答作比较时;或者当调查员反对一些调查项目,因为它们模糊不清、或者主观性太强,或者太复杂,或者过多的解释就可能替代调查对象的回答时,调查员方差就会增加。

4.社会地位差距。将调查员和调查对象结合在一起考虑是否会产生更多的调查员方差呢?目前,没有文献利用调查员和调查对象变量来解释调查员方差。但有关于调查员和调查对象结合的更一般的研究。有些方法论者争论说很少限制调查员和调查对象的交流,而后者大都认为所有的调查对象都差不多。这种观点,引出了Hyman等(1954)早期的研究。随后,Benney等(1956)又提出了关于回答误差和可观测的社会差距之间关系的争论。Dohrenwend等(1968)的研究认为,社会差距与调查误差的关系是曲线的:当社会差距很小时,调查员就很容易被调查对象接受从而有利于获得误差较小的调查结果;相反,当社会差距很大时,调查对象就会有潜在的较高的抵制反应。Weiss(1968)的研究表明了不同的观点:调查对象和调查员之间社会差距的大小并不是产生调查误差的本质原因,Dohrenwend等(1969)的评论文章也支持这一点。跟这个主题相关的很多文献都强调调查员的提示信号或者调查员与社会地位相关的一些反应都会影响调查结果。这是Williams(1964)倡导的核心,同时Williams的一些对Dohrenwend和Weiss文章的评论文章也说明了这一点。

5.意识形态。Cahalan等(1947)、Ferber等(1952)、Feldman等(1951)的研究都表明意识形态是决定调查误差的重要因素。调查员独特的意见、信仰、信心等都会对调查结果产生影响,更不用说调查员长期形成的意识形态对调查结果的持续影响。

此外,还有不少研究调查员方差来源的文献。如研究调查员的性别、年龄、性格、能力、社会地位、阅历、形象、态度、人际关系、提问的方式,甚至语调、种族等等对调查结果的影响。这些研究相对要分散一些,在此不再一一列举。

四、调查员方差的测定方法

J. Stevens Stock等(1951)根据一次具体调查实验发展了测定调查员的变化性对总的调查误差的影响的方法,他还深入讨论了抽样设计、问题类型等对调查员方差的影响; Morris H. Hansen等(1951)深入研究了调查员误差的测量方法,证明了调查员误差是调查误差的一个重要方面; Barbara Bailar等(1977)通过一个有控制的实验说明了调查员偏倚和方差的计算方法,同时,他还通过另外一个实验说明成功的调查和调查员特征与态度之间的关系;文章在国家犯罪调查和家庭收入调查中具体应用了Morris H. Hansen等(1951)的方法。王克林和刘建平(2009)分析了调查员误差的产生机理并据此建立了计量模型,然后结合运用整群抽样原理,提出了一种容易操作的测定调查员误差的方法。

五、结论

深入研究调查员方差是设计出有针对性的措施去降低调查员方差的前提。如,从调查员的选择上、培训上、评价上及报酬的支付等方面选择较好的方法去降低调查员方差,这是我们调查员方差研究的最终目的。一般研究调查员方差的文献都会在最后给出选取和培训调查员时应该注意的问题,也有文献专门研究如何降低调查员方差。如Albert B. Blankenship(1949)详细研究了调查员在实际调查工作中的实际操作技巧以及应该注意的问题; Schyberger(1967)通过一次具体调查研究了经验丰富和经验不足的调查员之间的差别,他发现按照调查项目支付工资的调查员比支付计时工资的调查员受到更大的激励;有训练的调查对象和仅仅是接到通知便接受调查的调查对象的调查结果差距巨大;Stock等(1951)建议通过培训和控制调查员、更认真细致的问卷设计、选用更大数量的调查员等方法来降低调查员方差; Happer W. Boyd(1970)的研究表明,调查员误差是市场调查研究中误差的主要来源,他给出了选拔、培训和控制调查员以降低调查误差的方法。

笔者认为,随着我国社会经济发展水平越来越高,人们对统计数据质量的要求越来越高,我国对调查员的关注和研究也一定会逐步向研究先进的国家靠近,我国提高统计数据质量的途径也会越来越多。

参考文献:

[1]John Freeman and Edgar W. Butler.Some Sources of Interviewer Variance in Surveys .The Public Opinion Quarterly, Vol. 40, No. 1 (Spring, 1976), pp. 79-91

[2]Morris H. Hansen. William N.Hurwitz, Eli S.Marks,and W.Parker Mauldin. Response Errors in Surveys. Journal of The American Statistical Association. 1951

[3]J. Stevens Stock and Joseph R. Hochstim. A Method of Measuring Interviewer Variability. The Public Opinion Quarterly, Vol. 15, No. 2 (Summer, 1951), pp. 322-334

[4]Barbara Bailar, Leroy Bailey, Joyce Stevens.Measures of Interviewer Bias and Variance .Journal of Marketing Research, Vol. 14, No. 3, Special Issue: Recent Developments in Survey Research (Aug., 1977), pp. 337-343

[5]王克林 刘建平:调查员误差的计量模型与测度方法[J].统计与决策.2009(10).11-12

[6]Albert B. Blankenship, Archibald Crossley, Myron S. Heidingsfield, Herta Herzog, Arthur Kornhauser. Questionnaire Preparation and Interviewer Technique. The Journal of Marketing, Vol. 14, No. 3 (Oct., 1949), pp. 399-433

误差理论论文范文5

【关键词】测量;不确定度评定;电学计量;误差

电学计量就是按照国家有关计量的法律法规,应用电测量器具,依据相应的检定规程对被测电参量进行定量分析的一门科学;是人们掌握电学知识,发展电学理论和电学技术的重要手段。电学计量技术具有测量灵敏度高、准确度高,易于实现直接、连续和远距离测量等特点。然而在电学测量的过程中对其的影响因素也很多,而且不易被察觉。在对电学仪器计量的实验中,测量的结果并不是被测产品的真实值,最早引用“误差”的概念引起了不小的争论,直到1927年,德国物理学家海森泊基于量子力学理论提出了不确定度关系。随后,不确定度评定理论被广泛地引用在对电学的计量中。

1.测量不确定度评定方法

不确定度是一个合理表征测量结果的分散性参数,它是一个容易定量、便于操作的质量指标。目前国内常用的不确定度评定主要分为基于统计理论的静态不确定度评定和基于新模型、新理论的动态测量不确定度两种评定方法。

不确定度评定过程如图1所示。

图1 不确定度评定过程

(1)静态不确定度评定

刘智敏提出的采用最大方差法来对测量结果的标准不确定度进行评定;宋明顺等人给出了测量值为一种最小二乘测量结果扩展的不确定度评定公式,此测量结果服从正态分布且相互独立,并在实际应用中得以验证,弥补了GUM在该问题表述上的不足。张海滨等人对测量不确定度评定模型进行了验证,用埃奇沃思级数展开形式来表示测量数据的分布函数,然后由蒙特卡罗模拟法产生大量符合此分布函数的测量数据的模拟值,把计算出的模拟值的标准差作为不确定度评定的验证值,从而能实现对各种不确定度评定模型的验证。

(2)动态不确定度评定

动态测量不确定度的理论是现代误差理论的精髓,也代表了当代误差理论的研究方向及进展。在理论上告别了以统计理论为基础的传统方法,弥补了基于统计理论的传统评定方法的不足。但由于动态不确定度评定起步较晚,它不能适用所有统计理论中的不确定度问题,如果把动态静态不确定度结合使用,会受到显著的效果。

2.影响电学计量检定和校准过程误差的因素

(1)测量人员

①人员误差

每个人的操作手法不同、对检定规程的理解不同、自身电学知识的掌握程度不同都可能会形成一定的系统误差。这些人为的误差可以通过对测量人员培训和勤练习的方式来使误差减少。

②读数误差

测量过程中读数应从垂直于仪表表面的固定角度观察指针进行读数,如从不同角度读数或者个人习惯性的估读方式即会造成系统误差。

③操作误差

在检定和校准的实际操作过程中,不同的操作方法也可以带来一定的误差,如转换机械式开关在转换过程中所用力度不同等方式。

(2)测量仪器

①标准量具

我们日常检定和校准过程中的标准量具如电阻表就有一定的级别,这就是它的系统误差,它是需要按电阻表生产设计的性能和相关的检定规程来规定的,并且具有有效期,但是如果标准量具已经超过有效期,系统误差就必须重新确定。在测量仪器生产中,使用的生产标准因应用而不同,规定的范围也不同,导致电子计量过程中的精准度和准确度也不同,测量出的这些数据也会产生系统误差。

②仪器仪表显示特性

每种仪器的灵敏度、准确度不尽相同,显示的有效数字位数也不同,如仪器显示的有效位数不够也会造成误差。此外还有刻线不清晰、光点不够亮、刻度不均匀等也会造成误差。

③数字仪表间隔采样

数字仪表是用间隔采样后通过A/D转换的方法把被测值变成数字量,这样的间隔采样就可能漏掉一些被测量的波动信息,从而产生误差。

(3)测量方法

①检定规程

测量仪器检定和校准规程是严谨的,需要严格按照该仪器的检定规程操作,测试人员如在检定和校准过程中脱离了检定规程,这样就会产生误差,这种误差是可以通过严谨的检测过程避免的。

②非标方法

在校准实验室中都会严格按照检定规程进行仪器的检定和校准,但在一些企业中会用到一些非标方法,因此由于校准方法的不一致,结果就可能会有差异,误差也就会随即产生。

(4)测量环境

测量环境属于检定和校准过程中影响不确定度的一大外部因素,很多外部环境的变化都会引起误差,其中包括空间外磁场和电路元件间产生的磁场、电场、静电、不符合检定规程的外部环境条件、湿度、压强和振动等条件都可以引起元件参数的变化而导致误差的产生。

(5)电路元件

①元件的稳定性

电路元件随着时间的推移会发生老化,它的数值也会随时间产生变化,而且这种变化是不易察觉的,更需要我们谨慎对待,要严格按照电路元件的使用期进行更换,这样才能避免电路元件对检定结果造成误差。

②元件的线性与非线性

我们根据元件的线性与非线性选择不同的处理方法,电流和电压的不同也会导致非线性元件的测量结果差异很大,例如灯泡的电阻等。

电学计量检定和校准过程中存在系统误差是不可避免的,本文就是通过分析测量不确定评定来了解影响测量过程产生系统误差的因素,从而尽可能的避免这些因素,使我们在日常检定和校准过程中测量仪器的测试值无限接近于它的“真实值”。这也是对我们校准实验室的考验,需要我们检定人员在准确度要求较高的电学测量和电学计量检定时万不可掉以轻心,要以认真的科学态度、严谨的工作方式对待电学计量工作。

参考文献

[1]刘智敏.不确定度评定的一种方法-最大方差法[J].宇航计测技术,1998(1):24-35.

[2]宋明顺,顾龙芳,陈意华.最小二乘测量结果不确定度的评定及案例[J].计量技术,2000(1):43-45.

[3]张海滨,王中宇,刘智敏.测量不确定度评定的验证研究[J].计量学报,2007(3):193-198.

误差理论论文范文6

关键词:概化理论;测量理论;运动成绩;成绩评定;主观

中图分类号:G804.47

文献标识码:A

文章编号:1007―3612(2006)01―0053―03

竞技体育的难美表现项群中,裁判员评分是评定运动成绩的主要方法。采用这种评定会给运动表现的结果带来很大的主观性。尤其在运动员水平相近、竞争激烈的情况下,某些项目裁判员的0.10甚至0.05分的评分之差,就会出现金牌得与失两种迥然不同的结果,产生“分配成功”而不是“竞争成功”的现象。为了确保评定结果的客观性和公正性,个国际单项联合会都采取了相应的措施,诸如不断完善评分方法,设立裁判员监控组,对裁判进行奖惩制度等方式来监测裁判员评分,有些运动项目还设计出相应的计算机应用软件对裁判员的评分进行实时监控。但是,这些手段仅仅是从评定结果上解决主观评定的问题,至于如何评价裁判员的评分一致性,判断评分主观差异的来源上还未见有恰当的方法。有人使用肯德尔和谐系数(简称w系数)和评分数据方差分析的方法进行判断,由于有些项目的评分并不能满足等级评分的条件,因此,这种方法并不科学。然而,就在主观评定方法陷入尴尬境地之时,现代心理测量学的概化理论从经典测量理论中脱胎而出,在原有理论模型的基础上进行了进一步的深入与拓展,形成新一代具有影响力的三大测量理论之一,并以它的精确性和可靠性受到了测量领域学者们的青睐。本文旨在介绍概化理论的产生背景和理论框架,并结合运动成绩主观评定的实际需要进行论述,以期对运动成绩的主观测评提供一条思路。

1 概化理论的产生与理论框架

1.1 概化理论的产生 概化理论(Genemlizability Theory)简称GT,足Cronbach,Gleser和Rajaratnan于1972年提出的,但由于其数学模型复杂,计算工作也相当繁杂,直到20世纪80年代后期才得以迅速推广,与经典测量理论CCT和项目反应理论IRT一起成为当今测量学界最有影响的三大理论。

信度是测量可信程度或一致性的表示。由于误差本身无法直接测量,经典测量理论中在实际运用中是根据信度操作定义和相关的方法来求解信度系数的,这种方法求解的信度系数往往对测量设计的不同而不同,误差难于控制,也不能有效分离误差的来源。而事实上,误差变异并非单一的结构,经典测量理论对误差的笼统划分与控制成为它在实际运动中最为突出的缺陷。

经典测量理论的另一个突出的局限在于“严格平行测验”(slrict parallel test)的理论假设,即要求子测验在内容、均数、变差、信效度方面完全相同。这在实际的测验中很难满足。

GT作为一种新的测量理论,具有其独特的优越性。首先,在理论假设上,扬弃了与经典测量理论的“严格平行测验假”,代之以“随机平行测验”这一弱假设,从而分析问题的条件很容易满足,在具体方法上,概化理沦利用方差分析技术,把测验变异分成多个郎分,每个部分对应于特定的误差来源,从而更便于测量误差的控制。概化理论最显著的特点是强调测量的具体情境,它认为,测量的根本目的不是为了获得特定条件下的测量结果,而是要以此来推断更广泛的条件下可能得到的测量结果。这种推断的准确性正是测量者应该关心的问题,由此可见,概化理论给传统的信度观念赋予了新的含义。

1.2概化理论的理论框架

1.2.1 测量情景的构成 测量情景由测量目标(object ofmeasuement)和测量侧面(facet of measurement)构成。测量目标指的是研究者希望描述的实体属性,如艺术体操中某种器械操的运动表现评定、武术教师教学质量的评定等等。各个测量侧面又分为各种水平(condition),比如用5种不同的工具测量人的身高,测量工具侧面就可以分为5种水平。

某一侧面的所有可能水平的全体称为可接受的观察全域。一次测量便是可接受的观察全域中的一个样例。可接受的观察全域包括决策者认为对某一决策来说是可以替换的各种观察。这里所说的决策可以是实际生活中的(比如:选择成绩最好的学生参加提高课程),也可以是用于形成某种科学结论的(比如:研究生教育对科学成就的影响)。测量对象在观察全域上的观察均分称为全域分,概化理论中的全域分类似于经典测量理论中的真分数”。

1.2.2 可靠性和“随机平行测验” 在经典测量理论中信度是一致性的指标,它注重的是两次测量、测验的两个部分或评分者间的一致性,而在概化理论中用可靠性(depeMability)概念代替了传统信度的概念,指的是从一个测验或是测量(如:行为观察、意见调查)的被测者得分到施测者同等程度接受的所有可能条件下被测者均分的概化的精确性,即从测量对象在样例测量上的得分到全域分的概化精确性,或者说是样例到可接受的观察全域的概化程度。概化越精确,越能从一个测量或测验的情况来推断观察全域的情况。概化理论可靠性的概念包含了“随机平行测验”的理论假设,即:所进行的测量是观察全域中的一个样例,也就是从观察全域中随机抽取出来的,观察全域的所有测量即使有差异,可通过随机抽样的原则来排除。这种“随机平行测验”假设比要求每次测量都完全等同的“完全平行测验”假设更容易实现。

1.2.3 误差来源的分解 针对经典测量理论无法对误差进行分解的缺陷,概化理论将方差分析的思想引进了测量领域,对测量误差进行了有效的分解。当决策者希望从一个测量概化到观察全域的所有行为上时,误差就出现了。假设有这样一组测量:观察20个被试在5个项目上的得分,如果每个项目在难度上是一致的,并且被试在每个项目上的得分都是一样的,那么被试在这5个项目上的得分可以概化到项目的观察全域上;如果项目的难度不一致,并且被试在项目上的得分依赖于项目的难度,那么从这5个项目上的被试得分概化到项目观察全域上就会产生误差,项目的难度就是潜在误差来源。以被试在项目上的得分为测量对象,项目为测量侧面的话,这一组测量有四种误差来源:1)被试的爱好、兴趣、思维等各方面的特质及能力的系统误差,称为被试效应(subject ef-feet)或是测量对象效应(the effect kf object of measurement);2)项目的难度差异,称为项目效应(itemeffect);3)项目对被试

的相对难度,如对某个被试来说相当简单的项目可能对另一个就显得十分地深奥,由此带米的误差被称为项目和被试的交互作用(the interaction between subject and item);(4)随机误差(如被试在被观察时的注意力的暂时转移等)和其它的一些没有定义和未知的误差来源。在概化理论中第三种和第四种误差来源往往是难以区分的,这种现象叫做混杂(confound)⑦。可见,概化理论对误差来源进行了合理的分解,有效弥补了经典测量理论对误差笼统定义的缺点。

1.2.4 测量设计 用概化理论进行信度计算,可以根据具体情况进行不同的测量设计。目前主要从侧面的个数、侧面间的关系、侧面和观察全域的关系三个维度上对测量设计进行分类。依据侧面的个数,可以将测量设计分为单侧面设计、双侧面设计和多侧面设计。此外,测旦设计还可以根据侧面和观察全域的关系,分为固定侧面(fixed facet)设计和随机侧面(random facet)设计。

1.2.5 概化研究(G研究)和决策研究(D研究) 概化理论的框架包括C研究(Generalizability Study)和D研究(DicisionStudy)。G研究确定测验情景关系,收集原始数据,并借助ANOVA或MANOVA方差或协方差分量分解的方法对测量情景中的误差进行分解;D研究则是在G研究的基础上,计算概化系数E2和依存性指标甲,在最大化概化系数和最小化误差基础上,选择最优测量方案。在D研究中,常常通过改变被试、项目和评分者的数量或将随机侧面变为固定侧面等方法来获得最大的概化系数,即将观察分数概化到全域上,这时的全域称之为概化全域(genemlizability universe)。对于固定侧面,可在其每个水平上分别进行概化,也可对各个水平的均值进行概化。测量往往由于其目的不同而被分为两种:常模参照测验(dornain referenced test)和准则参照测验(Criterion refer-enced test),的者反映的是某―被试在整个人群中的排名,而后者反映的是个体知识、技能、态度、能力的绝对水平。基于这两种测量,概化理论的决策研究分为就常模参照测验而言的相对决策(relative decision)和就准则参照测验而言的绝对决策(absolute decision)。

2 概化理论在体育测评中的具体应用方法

在借鉴其它学科研究成果的基础上,这里提出了概化理论的具体应用方法。首先,研究者要进行测量设计,考虑影响测评的因素和进行样本选择;其次,应用GENOVA专用软件进行数据处理;第三,进行G研究,得出各种主效应和交互效应的方差成分、各方差所占总方差的百分比和标准误;第四,进行D研究,考察不同D研究下概化系数的变化;第五,分析各种误差来源,采用Q系数考察评分者一致性程度并得出可靠的评价结论。

在体育领域的测评中,可以以武术比赛的评分为例进行具体分析。第一步,挖掘影响测评的主观因素,进行测评设计,测评效果的误差包括武术运动员p本身的技术水平引起的误差,裁判r引起的误差,武术测评内容i引起的误差,以及运动员与裁判的交互作用pr引起的误差,运动员与规定动作的交互作用pi引起的误差,裁判与测试内容的交互作用ir引起的误差,还有武术运动员、规定动作、裁判三者之间的交互作用pir以及所有的不确定因素引起的误差。因此,本测评是一个!oxixr的设计;第二步,将所得数据录人GENOVA,进行方差分析;第三步,通过对获得的数据进行分析,得出所有误差估计值,找出解释总方差变异的最大误差项,即引起武术运动员分数产生变异的最大来源,确定特定的概括全域;第四步,利用G变异估计值,得到相对误差和绝对误差,进而得到D研究的效度系数C系数。如果裁判的G系数较低,反映了评分者效应使得信度产生误差,需要对裁判进行职业道德、裁判水平等培训,明确了解评分细则,对测试内容产生有较充分的理解和体会。最后,可以利用甲系数检验测评结果稳定的一致性程度。本例可以用甲系数大小来考察裁判评分的一致性程度。

3 概化理论在运动成绩评价中的作用

基于以上对概化理论的了解,体育测量界的学者们可以应用概化理论对裁判员评分是否一致的问题进行检验,此外,还可以借助此理论分析评分差异的具体来源,井根据统计结果提出具体的解决方案。

3.1 确定影响运动表现结果评定的因素 在一次完整的比赛中,运动员的比赛成绩不仅受到运动员表现水平的影响,在表现难美项群的项群中,其结果还受到裁判员主观评定的制约。由于裁判的不公正而发生误判、错判的例子屡见不鲜。今年在雅典举行的第28届奥运会上,就由于裁判的不公正让我国痛失了一枚击剑男团金牌。某些不公正可以通过直观再现比赛现场的手段而观察到,但有些项目的裁判评分的误差却是隐藏在现象之后,所不为人觉察的事实。因此,采用概化理论来评价运动成绩的误差来源有现实意义。根据概化理论和裁判员对每个运动员成绩的评定数据,可以判断运动成绩产生的误差是来源于运动员表现水平的差异,还是裁判员主观评定的误差所致,或属于混杂误差。在运动成绩的主观评定误差中,主要是裁判员主观评定的误差,那么在这种情况下,政策的制定者可以据此来提出详细的应对措施和解决途径,如可以通过建立一支稳定的裁判队伍,尽可能地减少裁判员的变更;在比赛前可以对裁判员进行严格的培训,把握好评分的宽严尺度。例如,在艺术体操、体操和健美操比赛中的加分制应该尽可能地将分值和表现力的评判标准对应起来,增加其客观性。

3.2 确定裁判员评分信度 在估计多个裁判之间的一致性时,常用肯德尔和谐系数(简称w系数)作为信度指标。评分者采用等级评定的方法阅卷时,这样做是可取的;但是,当评分者用百分制或其它非等级评定的方法时,这样做就容易犯错误,因为w系数是多列变量间的等级相关系数,它只能反映评分者之间的相对一致性,并不涉及评分者之间的绝对差别。在这种情况下,评分者之间的系统偏差从总体来看也是随机误差。所以,此时w系数就不能正确地反应评分者信度的高低,但在实践中,由于没有适宜的统计指标,人们往往仍以w系数作为信度指标,这是一种误用。

既然w系数有上述误用问题,在多个裁判进行的成绩评定中,我们主张用概化理论所提出的依存性系数(系数)作为成绩评定的一致性指标。午系数的优点在于它不仅反映了评分中随机误差的大小,而且考虑了各评分者的系统偏差。在评分者之间存在系统偏差时,甲系数比w系数更能反映评分者一致性信度。

3.3 确定每个分项目的评分准确程度 在竞技体育的很多项目中都包括有分项目,如男子体操全能包括鞍马、单杠、双杠等。如果评定各项目的裁判员相同,就可以采用概化理论

分析各分项目评分的准确程度。

3.4 确定裁判员人数 概化理论的另一个重要应用价值在于能根据信度系数的选择来确定裁判员人数多少。概化理论中,应用者往往希望在评分信度一定的情况下,采用最少的评分人数。越为重要的比赛,对评分信度的要求越高,因此裁判人数的增加也就越为必要。研究者可以对比赛的重要程度划分等级,不同的等级采用不同的信度标准,计算需要的裁判人数。

4 概化理论的应用研究现状和前景

鉴于概化理论的优势,它在教育学和测量学领域受到了重视井得以应用。概化理论又可以按照形式分为单变量概化理论(univariate Generalizability theory,UGT)和多元概化理沦(multivariate Generalizability theory,MGT)。每种形式都有不同的应用范围。

单变量概化理论,不仅用于区分各误差分量(Shea等人区分工作评定的误差来源,1981),而对于测验和组合测验(test-lets)分数信度的探讨(Lee,Frisbie,1999)、标准参照测验界定分数(cut―off core)的误差研究以及绩效评价(performance as―sessment)中任务数量的确定(Gao,Shavelson,Baxter,1994;Lane,Lin,Ankenlnanrl,Stone,1996)都具有意义。尤其是在评分者一致性的研究方面是近来的热点。

误差理论论文范文7

关键词:误差理论;数值分析;教学

中图分类号:G642.4 文献标志码:A 文章编号:1674-9324(2014)14-0118-02

计算机与数学的有机结合形成了“科学计算”的研究方法,它的核心内容是以现代化的计算机以及数学软件为工具,以数学模型为基础进行模拟研究[1]。一个实际问题在计算机上的解决需要转化成数学模型,当数学模型不能够得到精确解时,通常要用数值方法求它的近似解,而后再编制成程序在计算机上运行。显然,这些计算方法是数值分析课程研究的对象,只有构造出好的算法才能有效的在计算机上解决数学问题。然而,构造计算方法的手段是近似,研究并分析算法的核心问题则是近似对计算结果的影响。随着授课经验的积累以及对这门课程了解的深入,作者越来越觉得误差的讲解应该成为整门课程讲授的重点和核心。实际问题通过建立数学模型在计算机上得到解决,每一步都会产生误差。只有一个对误差进行详尽分析的算法才能称之为一个好的算法。下面就误差对算法的影响以及算法的误差分析等几个方面进行阐述,从中可以看出将误差分析在课堂讲授中应当特别作为重点是很有实际意义的。

一、算法的稳定性

用一个算法进行计算,由于初始数据误差在计算中传播使计算结果误差增长很快,就是数值不稳定的[2]。在大部分数值计算教材中都能见到这样一个关于描述算法稳定性的例子,式(1)与式(2)两个公式是相互等价的,但是由于初始数据带有误差,计算结果就迥然不同。

In=I-nIn-1 n=2,3,L,7 (1)

In-1=■-■In-1 n=7,6,L,3,2 (2)

当初始数据带有误差时,式(1)的计算过程使得这个误差急剧扩散,速度为n!,假设初始数据I0的误差为δ,则当n=7时I7的误差为δ的5040倍。而式(2)却能够在计算的过程中逐步地缩小误差,控制误差的传播。这就是算法的稳定性问题。在常微分方程初值问题的数值解法中也会发生这样的问题。例如,分别用欧拉显、隐式格式和改进的欧拉格式计算初值问题y'(x)=-30y(x)y(0)=1在区间[0,0.5]上的数值解。结果如图1所示:

注意到在这个结果里,局部截断误差为2阶的改进欧拉法在h=0.3,0.4,0.5的值相对于局部截断误差为1阶的欧拉隐式公式在这些点的计算结果更加偏离了精确解。这是由于欧拉隐式公式的稳定性高于改进欧拉法。从这一方面也能够看出算法的稳定性问题在实际计算中的重要性。理论上的截断误差并不能正确地反映一个算法计算结果的好坏。

二、病态问题

关于病态问题可以用一句“失之毫厘,谬以千里”来加以描述,在病态问题中,初值数据的微小偏差会引起结果的巨大差异。因此,在讲述课程绪论的时候也提到了问题的病态性。例如线性方程组1 11 1.0001x1x2=23 (3)

它的精确解为x=(2,0)T。若常数项做微小变化,即考察线性方程组1 11 1.0001x1x2= 22.0001 (4)

此时它的精确解为x=(1,1)T,从这个例子可以看到常数项的第2个分量只有万分之一的微小变化,然而方程组的解却变化很大。这样的方程组就称之为病态方程组。病态方程组的影响在《数值分析》的几个章节中都是很有必要在课堂中加以解释的。因此,必须要去寻求避免出现此类问题的解决方案。在这种情形下可以引导学生进行思考,既要保持原有的解法,又要避免求解线性方程组。解决的方法就是以正交的函数族代替φi(x),用正交多项式做最小二乘曲线拟合,系数矩阵变为对角矩阵,就可以避免利用线性方程组,而能够直接计算出系数。同样的,在插值法的推导以及数值微积分中,由于考虑到求解线性方程组可能会遇到病态方程组或者计算过程比较繁杂,都需要另外寻求解决方案,由此可见,清晰而明了地提醒学生时时需要注意到求解方程组的病态问题,才能够尽可能地避免在实际求解中实际值偏离理论值的情况,这一点,无论是在算法的讲解还是在实际问题的求解中都是不可避免的。

三、利用误差创造新算法

误差的分析既可以对算法的优劣进行判断,还可以利用误差来创造新的算法。例如,在数值微积分这一章节中的推导自适应的积分方法,复合梯形公式的余项公式中涉及到f(x)在η点的二阶导数f"(η),在实际中由于f(x)复杂或未知,难以通过余项公式来估计误差,而需要改变思路。也就是误差的估计不能使用余项公式,但观察余项公式后,可以引导学生考虑利用区间折半以后的复合梯形公式的余项中f"(η)与折半前复合梯形公式余项中的f"(ξ)近似相等,得到如下的式子:■=■≈■ (5)

对上式进行整理后得到:I-T2n≈■(T2n-Tn)从而只需要折半前后积分值的差的绝对值达到规定的误差限,就可以停止折半的计算过程,最后一次算得的积分值就是满足精度要求的近似值。另一方面,从式(5)还能推导出I≈■T2n-■Tn,仔细比对之后发现的计算结果恰好是复合Simpson公式,也就是说复合Simpson公式可以由复合梯形公式计算得到,而在已知点一样的情况下,复合Simpson公式的计算精度明显高于复合梯形公式,因此,可以用这种方法加速复合梯形公式的收敛。以此类推,在同样的原理下,复合Simpson公式可以加速为复合Cotes公式,进一步加速为最终的Romberg公式。而这个有用公式的得到,就是源自对误差的分析。

综上所述,算法的误差分析与课程每一个环节都息息相关,在讲解算法的时候都很有必要提醒学生时刻注意到对误差进行分析,如果脱离了误差分析,而仅仅在于讲授算法,就失去了算法应用于实际的意义。本文并没有对算法的误差分析方法进行讨论,而是从误差分析的另一个角度剖析了这个内容在课程讲授中的重要性,引导学生在学习过程中要注意实际问题中的舍入误差带来的影响和理论误差公式的应用。通过强调误差分析,能够在一定程度上提升学生对待问题的严谨性与探索性,使得数值分析课程的教与学更加丰富,更加贴近工程计算的实质。

参考文献:

误差理论论文范文8

1理想变压器电流变比公式的推导

理想变压器的电流变比公式在一些《电磁学》教材中的推导是不够严谨的,由于这一原因,原文三设法推导出结论:“理想变压器的电流变比公式不是严格成立的”但在推导过程中存在不少的问题,造成结论不正确,下面笔者重新推导电流变比公式.

但原文三运用了(15)式去推导,很多《电磁学》教材中也出现了(14)、(15)式的错误写法,这样推导出的结果必然是错误的,如果推导出原线圈的电压与电流同相,但实际上是相差90°了.

6理想变压器空载电流的分析

理想变压器空载时,副线圈也具有电动势,而具有电动势就需要有即时(或曾经)的“非静电力”移动电荷做功,所以理想变压器空载时,原、副线圈中各有一固定值的电流,叫空载电流或励磁电流.这一问题在《中学物理》2012年第2期刊登周孝明老师的《“只要”和“只有”相同吗》文章中也有类似论述,文章论述了“导体回路不闭合同样能产生感应电流”,所以副线圈电流大于负载电流.并且理想变压器空载时,电流变比公式也是严格成立的.

误差理论论文范文9

关键词: 有机酸 二甲基亚砜 电离常数 连续极化模型

对大量有机化合物和无机化合物的酸度的研究已有相当长的一段时间,并通过不同的实验方法测出它们的pKa值,与此同时对水溶液中pKa值的理论计算有了很大程度的进步。从最初的Jorgensen[1],[2]等人首次使用从头计算法和自由能微扰理论到接下来的积分方程理论和量子力学―分子力学联合方法[3],到近几年的连续溶剂化模型(PCM)[4]都对研究有机物的电离进行了多方面的改进。

许多文献用经验计算或从头计算法来计算pKa值的报道都有史可查[5],[6],而大部分都是关于水溶液中pKa值的计算。Wiberg[7]等人计算出了在DMSO中质子转移的吉布斯自由能,但是并没有计算出相应的pKa值。本文中我们采用了PCM模型中的HF法预测了十种有机酸在DMSO的pKa值,同时我们将实验数据应用到该值的计算中来,和实验数值进行对比。

1.计算方法

在DMSO中有机酸pKa的理论计算可以采用下面的质子转移反应:

HA+OHA+HO(1)

方程(1)可以产生以下平衡关系式(2)

=e=(2)

而G*可由以下得到

G*=G*+G*(3)

G*=G*(A)+G*(HO)-G*(HA)-G*(OH)(4)

在方程(2)的两边取负对数,我们可以得到

pK(HA)=pKa(HO)+(5)

在本文中我们运用方程(3)(4)(5)来计算有机酸的pKa值,这里水的pKa实验值31.2。

本文采用Gussian98程序包,运用HF法在6-31+G(d)基组完全优化出中性组分和离子组分的稳定结构,然后利用PCM模型(采用介电常数为46.7)计算出了溶剂化自由能,由得到的数据通过统计热力学计算出有机酸的pKa值。

2.结果与讨论

本文所研究的有机酸都具有不同的官能团,在这些官能团所处可电离的H是同O,N,C连在一起的,在此我们同样可以计算出HF的pKa值。

将运用HF方法计算出的十种化合物热力学数据和pKa值列入表1中:

从表1中所列的有机物pKa的理论值与实验值对比我们可以看出,主要偏差存在于含氮酸的测定上(大于十个单位),用HF法测定氢氟酸时得到最小偏差为1.4个单位。测含氮酸的Pka值时误差最大,大多都大于10个单位,很可能是因为这些化合物是两性物质,其中HCONH的pKa偏差最大为12.2个单位。这种HF方法的所测十种有机酸得pKa平均误差为3.77,如果除去误差较大的含氮酸,则平均误差为1.4。因此用PCM模型中的HF方法来计算有机酸的pKa其误差是较小的。

为了验证PCM模型中的HF方法适合于计算有机酸的pKa,我们采用从NIST数据库[9]中得到的气相反应吉布斯自由能的实验值和Gussian计算出的溶剂化自由能的理论值来计算pKa。分别运用HF方法于PCM中得到的pKa及实验值列入表2中:

表2 在HF方法中运用混合的理论(溶剂化贡献)-实验(气相贡献)得到的pKa计算值和实验值

从表2我们可以看出利用混合方法测pKa值产生的偏差大多数都小于用纯理论计算所的偏差。在HF测定氢氟酸时偏差最小,与实验pKa值相比偏差可以忽略;而CHOH和CHCHOH的pKa偏差也很小为0.2和0.7。另外混合方法中的HF法,CHOH、CHCOOH和HF各自pKa值的理论值和实验值吻合得都很好。同时,CHCOOH和CHCONH在这种方法中的偏差极其相近,分别为5.3和5.1。从表中可得这种HF混合方法的平均误差是4.06,如果不考虑具有最大偏差的含氮酸,则HF方法的平均误差分别为2.1。由此可见,运用混合HF法测得有机酸的pKa值其与实验值偏差也是较小的。

3.结论

本文对含有不同官能团的十种有机酸,采用PCM模型中的HF方法来计算其pKa。结果表明运用HF方法在PCM测得的pKa值通过实验值校正后,其值与实验数值吻合度较高,不仅在纯理论方法中,在混合方法中结果也是如此。因此在连续介质模型(PCM)中的HF法将在理论上被广泛地运用于预测有机物的pKa。

参考文献:

[1]Jorgensen,W.L.;Briggs,J.M.;Gao,J.J.Am.Chem.Soc,1987:109,6857.

[2]Jorgensen,W.L.;Briggs,J.M.J.Am.Chem.Soc,1989:111,4190.

[3]Gao,J.;Li,N.;Freindorf,M.J.Am.Chem.Soc,1996:118,4912.

[4]Cossi,M.;Barone,V.;Cammi,R.;Tomasi,J.Chem.Phys.Lett,1996:255,327.

[5]Chipman,D.M.J.Phys.Chem.A,2002:106,7413.

[6]Almerindo,G.I.;Tondo,D.W.;Pliego,J.R.,Jr.J.Phys.Chem.A,2004:108,106.

[7]Wiberg,K.B.;Castejon,H.;Keith,put.Chem,1996:17,185.

[8]Bordwell,F.G.Acc.Chem.Res,1988:21,456.

精品推荐