文章详情

监测数据的统计处理和结果表述

日期:2024-05-01 04:58
浏览次数:3355
摘要:
一、基本概念
1、误差:测量值与真值之间的差值;
①、真值(Xt):客观值或实际值;
理论真值:例如三角形内角之和等于180°;
约定真值:国际单位制所定义的真值;
标准器(物质)的相对真值:高**标准器的误差为低**标准器或普通仪器误差1/3—1/20时,则可认为前者是后者的相对真值;
②、分类:
系统误差:又称可测误差、恒定误差,方法、仪器、试剂、恒定人员或环境所造成;
偶然误差:又称随机误差、不可测误差,是由测定过程中各种随机因素的共同作用所造成,服从正态分布;
过失误差:又称粗差,是由测量过程中犯了不应有的错误所造成;
③、表示方法
**误差=X-Xt   即测量值-真实值
2、偏差:个别测定值Xi与多次测定均值()的偏离。
①、**偏差d:d=Xi-
②、相对偏差:
③、算术平均偏差:
④、相对平均偏差:
3、标准偏差
①、差方和:
②、样本方差:
③、样本标准偏差:
④、样本相对标准偏差(变异系数):
⑤、总体方差:
总体标准偏差:
其中:N—总体容量;  μ—总体均值
⑥、极差:一组测量值中*大值与*小值之差,表示误差的范围,以R表示,R=xmax-xmin
4、总体、样本、平均数
①、总体和个体:研究对象的全体称为总体,其中一个单位叫个体;
②、样本和样本容量:总体中的一部分叫样本,样本中含个体的数目叫样本的容量;
③、平均数
算术均数(均数):
样本均数:
总体均数:
几何均数:
中位数:将各数据按大小顺序排列,位于中间的数即为中位数,若为偶数取中间两数的平均值。
众数:一组数据中出现次数*多的一个数据。
5、正态分布
相同条件下对同一样品测定中的随机误差,均遵从正态分布。
正态概率密度函数为:
式中:x —由此分布中抽出的随机样本值;
μ—总体均值,是曲线*高点的横坐标,曲线对μ对称;
σ—总体标准偏差,反映了数据的离散程度;
正态分布总体的样本落在下列区间内的概率
区间
μ±1.000σ
μ±1.645σ
μ±1.960σ
μ±2.000σ
μ±2.576σ
μ±3.000σ
落在区间内的概率
68.26
90.00
95.00
95.44
99.00
99.73
正态分布曲线说明:
①、小误差出现的概率大于大误差,即误差的概率与误差的大小有关;
②、大小相等,符号相反的正负误差数目近于相等,故曲线对称;
③、出现大误差的概率很小;
④、算术均值是可靠的数值;
二、数据处理
1、有效数字:四舍六入五考虑,五后非零则进一,五后皆零视奇偶,五前为偶应舍去,五后为奇则进一。
例:将下列数值修约到只保留一位小数。
14.3426→14.3
14.2631→14.3
14.0500→14.0
14.1500→14.2
14.2500→14.2
14.2501→14.3
加减法:以小数点后位数*少的数为依据。
例:0.0121+25.64+1.05782=0.01+25.64+1.06=26.71
乘除法:以有数数字位数*少的那个数为依据。
例:0.0121×25.64×1.05782=0.0121×25.6×1.06=0.328
计算过程中,可以暂时多保留一位可疑数字,得到*后结果时,再弃去多余的数字。
2、可疑数据取舍
离群数据:明显歪曲试验结果的测量数据;
可疑数据:可能会歪曲试验结果,但尚未经检验断定其是离群数据的测量数据;
对离群数据要进行统计检验:
①、Dixon(狄克逊检验:适于一组测量值的一致性检验和剔除离群值。
a、将一组测量数据从小到大顺序排列为x1、x2、x3、……xn,x1和xn分别为*小可疑值和*大可疑值;
b、下表计算公式求Q值
狄克逊检验统计量Q计算公式
值范围
~7
~10
~13
~25
可疑数据为*小值x1 时
可疑数据为*大值xn 时
c、根据给定的显著性水平α和样本容量n从表中查得临界值Qα。
d、若Q≤Q0.05则可疑值为正常值。
若Q0.05<Q≤Q0.01则可疑值为偏离值。
若Q>Q0.01则可疑值为离群值。
②、Grubbs检验:适于多组测量值的均值的一致性和剔除离群均值。
a、有L组测定值,每组n个测定值的均值分别为 、 …、 ,则*大均值记为,*小均值记为 ;
b、由n个均值计算总均值 和标准偏差 :
       
c、可疑均值为*大值 时:
可疑均值为*小值 时,
d、根据测定值组数和给定的显著性水平α,查得T;
e、若T≤T0.05,则可疑均值为正常均值;
若T0.05<T≤T0.01,则可疑均值为偏离均值;
若T>T0.01,则可疑均值为离群均值,应予剔除,即剔除含有该均值的一组数据。
三、监测结果表述
1、用算术均数 代表集中趋势;
2、用算术均数和标准偏差表示测定结果精密度 ;
3、用( ,CV)表示结果,CV——相对标准偏差,变异系数。
4、均数置信区间和“t”值
均数置信区间是考察样本均数()与总体均数(μ)之间的关系,即以样本均数代表总体均数的可靠程度。
样本均数的均数符号为 ;样本均数的标准偏差符号为。标准偏差(s)只表示个体变量值的离散程度,而均数标准偏差是表示样本均数的离散程度。
均数标准偏差的大小与总体标准偏差成正比,与样本含量的平方根成反比:
样本均数与总体均数之差对均数标准差的比值称为t值:
则移项
根据正态分布的对称性特点,应写成
式中右面的、s和n从测定可得,t与样本容量(n)和置信度有关,而置信度可以直接要求指定。t值可以从表中查得。
四、测量结果的统计检验
t检验:用计算t值和查t表的方法来判断两均之差是属于抽样误差的概率有多大,即对这些差异进行“显著性检验”;
当抽样误差的概率较大时,两均数的差异很可能是抽样误差所致,亦即两均数的差别无显著性意义;如其概率很小,即此差别属于抽样误差的可能性很小,因而差别有显著意义。
t检验判断的通则是:
当t<t0.05(n),即P>0.05,差别无显著意义;
当t0.05(n)<t≤t0.01(n),即0.01<P≤0.05,差别有显著意义;
当t≥t0.01(n),即P≤0.01差别有非常显著意义。
1、样本均数与总体均数差别的显著性检验
例:某含铁标准物质,已知铁的保证值为1.06%,对其10次测定的平均值为1.054%,标准偏差为0.009。检验测定结果与保证值之间有无显著性差异。
解:     n=10 n’=10-1=9 s=0.009%
         |t|=2.11
查表:t0.05(9)=2.26,
|t|=2.11<t0.05(9) P>0.05,即差别无显著意义,测定正常。
2、两种测定方法的显著性检验
例:为比较用双硫腙比色法和冷原子吸收法测定水中的汞含量,由六个合格实验室对同一水样测定,结果如下表所示,问两种测汞方法的可比性如何?
方法
1
2
3
4
5
6
双硫腙比色法
4.07
3.94
4.21
4.02
3.98
4.08
 
冷原子吸收法
4.00
4.04
4.10
3.90
4.04
4.21
 
冷原子吸收法
0.07
-0.01
0.11
0.12
-0.06
-0.13
0.01
X2
0.0049
0.0100
0.0121
0.0144
0.0036
0.0169
0.0169
解:
查表得,t0.05(5)=2.57
T=0.0375<2.57=t0.05(5)  P<0.05,
差别无显著意义,即两种分析方法的可比性很好。
五、直线相关和回归
1、相关和直线回归方程
相关关系:变量之间既有关系又无确定性关系,称为相关关系,它们之间的关系式称为回归方程式,*简单的直线回归方程为y=ax+b,式中a、b为常数,可根据*小二乘法来求:
   
2、相关系数
相关系数是表示两种变量之间关系的密切程度的指标,符号“γ”,其值在-1~+1之间:
①、若x增大,y也相应增大,x与y正相关,0<γ<1;若γ=1,称完全正相关。
②、若x增大,y相应减小,x与y负相关,-1<γ<0;若γ=-1,称完全负相关。
③、若y与x变化无关,称x与y不相关,γ=0。
3、相关系数显著性检验
若总体中x与y不相关,在抽样时由于偶然误差,可能计算所得γ≠0。所以应检验γ值有无显著意义,方法如下:
(1)求出γ值;
(2)按 求出t值,n为变量配对数,自由度n’=n-2;
(3)查t值表(一船单侧检验);
若t>t0.01(n),P<0.01,γ有非常显著意义而相关;
若t<t0.1(n),P>0.1,γ关系不显著;

苏公网安备 32059002001825号