质量特性数据统规律.docx

上传人:scccc 文档编号:14164369 上传时间:2022-02-03 格式:DOCX 页数:12 大小:20.37KB
返回 下载 相关 举报
质量特性数据统规律.docx_第1页
第1页 / 共12页
质量特性数据统规律.docx_第2页
第2页 / 共12页
质量特性数据统规律.docx_第3页
第3页 / 共12页
质量特性数据统规律.docx_第4页
第4页 / 共12页
质量特性数据统规律.docx_第5页
第5页 / 共12页
亲,该文档总共12页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《质量特性数据统规律.docx》由会员分享,可在线阅读,更多相关《质量特性数据统规律.docx(12页珍藏版)》请在三一文库上搜索。

1、质量特性数据统规律作者:日期:质量特性数据的统计规律一、总体、个体与样本产品的质量可以用一个或多个质量特性来表示。这里的特性可以是定量的,也可以是定性的。例如灯泡的寿命,钢的成分等都是定量 特性;而按规范判定产品为“合格”或“不合格”,则是一种定性特 征。在质量管理中,通常研究一个过程中生产的全体产品。在统计中, 将研究、考察对象的全体称为总体。例如某个工厂在一个月内按照一 定材料及一定工艺生产的一批灯泡。总体是由个体组成的。在上例中, 这批灯泡中的每个特定的灯泡都是一个个体。如果总体中包含的个体 数不大,而对产品质量特性的观测(例如测量)手段不是破坏性的,工 作量也不大,那么有可能对总体中的

2、每个个体都进行观测,以得到每个个体的质量特性值。但是如果总体中的个体数 N很大,甚至是无限 的,或者观测是破坏性的或观测的费用很大, 那么不可能对总体中的 每个个体都进行观测。通常的做法是从总体中抽取一个或多个个体来 进行观测。抽出来的这一部分个体组成一个样本,样本中所包含的个体数目称为样本量。通过对样本的观测来对总体特性进行研究, 是统 计的核心。上述总体、个体和样本的概念是统计的基本概念, 从上面的叙述 中,这些概念都可以是具体的产品。但有时为了表达的方便,当研究 产品某个特定的质量特性 X时,也常把全体产品的特性看做为总体, 而把一个具体产品的特性值x视为个体,把从总体中抽出的由n个产

3、品的特性值xi, X2,,xn看做为一个样本。例1.1-1从一个工厂一个月内生产的一批灯泡中抽取 n=8个灯 泡,进行寿命试验,得到这8个灯泡的使用寿命为(单位为小时):325, 84, 1244, 870, 645, 1423, 1071, 992这 8 个灯泡或相应的使用寿命即为一个样本,样本量 n=8。从总体中抽取样本的方法称为抽样。为使抽取的样本对总体有代 表性,样本不能是有选择的,最好应是随机抽取的,关于这一点,以 后我们还要详细解释。二、频数(频率)直方图及累积频数(频率)直方图为研究一批产品的质量情况,需要研究它的某个质量特性(这里为了叙述简单起见,仅讨论一个质量特性,有必要时也

4、可以同时讨论 多个质量特性)X的变化规律。为此,从这批产品(总体)中抽取一个 样本(设样本量为n),对每个样本产品进行该特性的测量(观测)后得 到一组样本观测值,记为xi, X2,,xn,这便是我们通常说的数据。为了研究数据的变化规律,需要对数据进行一定的加工整理。 直 方图是为研究数据变化规律而对数据进行加工整理的一种基本方法。 下面用一个例子来说明直方图的概念及其作法。例1.1-2食品厂用自动装罐机生产罐头食品,从一批罐头中 随机抽取100个进行称量,获得罐头的净重数据如下:342352346344343339336542M734034035034733634134934834234634

5、734634534435034?352340356339348338342347347344343349341541340347342337344340344346342344345338351345339343345344344344M334534535035334535235。345343347354351)543S50544351348352344345349332343340346342335349S48344347341346341342为了解这组数据的分布规律,对数据作如下整理 :(1)找出这组数据中的最大值Xmax及最小值Xmin,计算它们的差R=XnaXmin, R称为极值,也

6、就是这组数据的取值范围。在本例中 Xmax=356, Xmin=332,从而 R=356332=24(2)根据数据个数,即样本量n,决定分组数k及组距ho一批数据究竟分多少组,通常根据n的多少而定,不过这也不是 绝对的,表1.1-1是可以参考的分组数。9选才I k的原则是要能显示出数据中所隐藏的规律,组数不能过 多,但也不能太少。每一组的区间长度,称为组距。组距可以相等,也可以不相等。 组距相等的情况用得比较多,不过也有不少情形在对应于数据最大及 最小的一个或两个组,使用与其他组不相等的组距。 对于完全相等的 组距,通常取组距h为接近R/k的某个整数值。在本伤J中,=100,取 k=9, R/

7、k=24/9=2.7 ,故取组距 h=3。(3)确定组限,即每个区间的端点及组中值。为了避免一个数据 可能同时属于两个组,因此通常将各组的区间确定为左开右闭的:(a 0? a1 , (a i, a2,,(a k-i, ak通常求 a0xmaxo 等距分组时,a1二aD+h, a=a+h,,ak=a-i+h,而每一组的组中值在本例中取a=331.5,则每组的组限及组中值见表 1.1-2。(4)计算落在每组的数据的频数及频率确定分组后,统计每组的频数,即落在组中的数据个数ni以及频 率fi=ni/n ,列出每组的频数、频率表,见表 1.1-2 。(5)作频数频率直方图在横轴上标上每个组的组限,以每

8、一组的区间为底,以频数 (频 率)为高画一个矩形,所得的图形称为频数(频率)直方图,如图1.1-1。 到在本例中频数直方图及频率直方图的形状是完全一致的。 这是因为 分组是等距的。在分组不完全等距的情形,在作频率直方图时,应当用每个组的 频率与组距的比值fi/hi为高作矩形。此时以每个矩形的面积表示频 率。(6)累积频数和累积频率直方图还有另一种直方图使用的是累积频数和累积频率。以累积频率直方图为例,首先要计算累积频率 F, E是将这一组的频率与前面所有 组的频率累加,也即第1组的F尸fi,第2组的F2=fi+f2, 一般的,Fi= J 本例中的各组F值也见表1.1-2。如果以每组的累积频率F

9、为高作矩形,所得的直方图称为累积频 率直方图,本例中的累积频率直方图如图1.1-2所示。可以从直方图获得数据的分布规律,其中包含数据取值的范围, 以及它们的集中位置和分散程度等信息。应当引起注意的是,如果我们观测的数据量(即样本量)n很大, 而分组又很细,那么从频率直方图及累积频率直方图可以分别得到一 根光滑曲线,关于这一点我们将在本章第三节详细讨论。三、数据集中位置的度量对一组样本数据,可以用一些量表示它们的集中位置。这些量中, 常用的有样本均值、样本中位数和样本众数。(一)样本均值样本均值也称样本平均数,记为 ,它是样本数据X1, X2,, Xn的算术平均数:例1.1-3轴直径的一个n=5

10、的样本观测值(单位:cm)为:15.09 , 15.29, 15.15, 15.07, 15.21 ,则样本均值为:=15.09+15.29+15.15+15.07+15.21)=15.162 对于 n 较大的分 组数据,可利用将每组的组中组 X,i用频率,加权计算近似的样本 均值:例1.1-4在例11.2中,100个罐头的净量的均值按分组计算为=333 X 0.01 十 336 X 0.04 十 339 乂 0.11+ +357 乂 0.01 =34508/100=345.08样本均值是使用最为广泛的反映数据集中位置的度量。它的计算比较简单,但缺点是它受极端值的影响比较大。(二)样本中位数样

11、本中位数是表示数据集中位置的另一种重要的度量,用符号Me或 表示。在确定样本中位数时,需要将所有样本数据按其数值大 小从小到大重新排列成以下的有序样本:X(1) , X,X(n)其中X(1)=Xmin, X(n) =Xmax分别是数据的最小值与最 大值。样本中位数定义为有序样本中位置居于中间的数值,具体地说:例1.1-5对例1.1-3中的5个轴直径数据进行按从小到大的 重新排序,得到如下有序样本:15.07,15.09,15.15,15.21,15.29 这里 n=5为奇数,(n+1)/2=3 , 因而样本中位数 Me=x3)=15.15。注意,在此例中,中位数15.15与均值15.162很接

12、近。与均值相比,中位数不受极端值的影响。因此在某些场合,中位 数比均值更能代表一组数据的中心位置。(三)样本众数样本众数是样本数据中出现频率最高的值,常记为Mod例如对例1.1-2中的罐头净量,100个数据中,344出现的次数最多,为12 次,因此Mod=344样本众数的主要缺点是受数据的随机性影响比较 大,而且对大的n,也很难确定,有时也不惟一,此时较多地采用分 组数据。在本例中第5组(343.5 , 346.5的频率为0.30,是所有组 中最高的,因而该组的组中值345可以作为众数的估计。注意到该数 与前面定的344相差不大。四、数据分散程度的度量一组数据总是有差别的,对一组质量特性数据,

13、大小的差异反映 质量的波动。也有一些用来表示数据内部差异或分散程度的量, 其中 常用的有样本极差、样本方差、样本标准差和样本变异系数。(一)样本极差样本极差即是样本数据中最大值与最小值之差,用R表示。对于有序样本,极差R为:R=Xn)-X (1.1-4)例如在例1.1-3 , 5个轴直径数据的极差 R=15.21-15.09=0.12 。样本极差只利用了数据中两个极端值,因此它对数据信息的利用 不够充分,极差常用于n不大的情况。(二)样本方差与标准差数据的分散程度可以用每个数据 Xi离其均值 的差Xi-来表示, Xi-称为Xi的离差。对离差不能直接取平均,因为离差有正有负,取平均会正负相抵,无

14、法反映分散的真实情况。当然可以先将其取绝对 值,再进行平均,这就是平均绝对差:但是由于对绝对值的微分性质较差,理论研究较为困难,因此平 均绝对差使用并不广泛。使用最为广泛的是用离差平方来代替离差的 绝对值,因而数据的总波动用离差平方和来表示,样本方差定义为离差平方和除以n-1 ,用s2表示:因为n个离差的总和为0,所以对于n个独立数据,独立的离差 个数只有n-1个,称n-1为离差(或离差平方和)的自由度,因此样本 方差是用n-1而不是用n除离差平方和。样本方差正的算术平方根称为样本标准差,即:注意标准差的量纲与数据的量纲一致。在具体计算时,离差平方和也可用以下两个简便的公式因此样本方差计算可用以下公式对例1.1-3的轴直径数据,离差平方和、样本方差及样本标准差 的计算可列表进行。为计算方便,可以将数据减去一个适当的常数, 这样不影响样本 方差及标准差的计算结果。例如,在本例中,将每个数据减去15,即可大大减少计算量。在实际使用中还可以利用计算器来计算, 特别 是许多科学计算用的计算器,都具有平均数、方差与标准差的计算功 能。(三)样本变异系数样本标准差与样本均值之比称为样本变异系数,有时也称之为相 对标准差,记为cv:例如对例1.1-2 的轴直径数据,样本变异系数cv=0.0901/15.162=0.0059ii

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1