数据的计量与类型..doc

上传人:scccc 文档编号:12662780 上传时间:2021-12-05 格式:DOC 页数:5 大小:20KB
返回 下载 相关 举报
数据的计量与类型..doc_第1页
第1页 / 共5页
数据的计量与类型..doc_第2页
第2页 / 共5页
数据的计量与类型..doc_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《数据的计量与类型..doc》由会员分享,可在线阅读,更多相关《数据的计量与类型..doc(5页珍藏版)》请在三一文库上搜索。

1、Part I数据的计量与类型一、数据的计量尺度(一定类尺度又称类别尺度 ,按事物的某种属性对其进行平行的分类或分组。 (只能测度事物 之间的类别差 ,其他差别无法得知例 :按照性别将人口分为男、女两类 ,按肤 色分为 白种人、黄种人、棕种人、黑种人四类 ,按洲别分为亚洲人、欧洲人、美 洲人、非 洲人、澳洲人五类。(二定序尺度又称顺序尺度 , 是对事物之间等级差别和顺序差别的一种测度。 它不仅可以测 度 类别差 , 还可以测度次序差。 ( 不能测量类别之间的准确差值 , 只能比较大小 , 不能 进行加、 减、 乘、 除数学运算 例:人可以根据年龄分为幼年、 少年、 青年、 中 年、壮年、老年等类

2、。满意程度可分为非常满意、比较满意、没有不满、不满 意、很不满意几类。(三定距尺度又称间隔尺度 , 是对事物类别或次序之间距离的测度。 该尺度通常使用自然或 物理单位作为计量尺度。 例:30 °C 和 20之间相差 10, -30C° 和 -20之间也 是 相差 10。再比如 , 1等星比 2等星亮 10倍, 0等星比 1等星亮 10倍, -1等星又比 0 等星亮 10 倍。 定距数据可以进行加、 减运算 ,不能进行乘、 除运算。 其原因为定 距尺度中没有绝对零点 (定距尺度中的 “0是”作为比较的标准 ,不 表示没有 。(四定比尺度又称比率尺度 ,由于定比尺度有绝对零点

3、(定比尺度中的 “0表”示没有,或者 是理 论上的极限 。 因此, 不仅可以进行加减运算 , 还可以进行乘除运算。 例如, 绝对温 度 300K(27 时理想气体的体积 273K(0 时的 1.1倍, 温度比也是 1.1倍, 则绝对 温度和体积都是定比尺度。 一般来说 , 定比尺度的数据不可能取负值。 一般也不会 取零值, 因为要么就是不存在了 , 要么就是极限情况。 如, 绝对零度 只能无限接近 , 不可能完全达到。 如果一个物体的体积为零 , 那么它要么不存在 , 要么是数学中的 抽象概念 ,比如,几何中的点、线、面的体积都为零。而一个人 的年龄为 0 时呢?作 为社会学意义上的人 ,可以

4、认为它是极限 (开始 ;作为生 物学上的人 ,则是定距尺度 的。通常:定比尺度的数据取对数 ,就会变成定距尺度的数据。比如 ,声音的频率 , 人 感觉到的是声音高多少 , 不是频率之差 , 而是频率之比 :高 1 个八度就是频率 变为原 来的 2倍, 高 2个八度就是频率变为原来的 4倍, 高 3个八度就是频率变 为原来的 8 倍;低 1个八度就是频率变为原来的 1/2,低 2个八度就是频率变为 原来的 1/4; 高 1 个五度就是频率变为原来的 3/2, 高 2个五度就是频率变为原 来的 9/4(按照五度相 生律 ,五度的频率比不要求掌握 。声音的强度与分贝的 关系也是这样。声音每增 加 2

5、0分贝,强度就增加 10 倍。二、数据的类型统计数据大体上分为两种类型 :定性的数据和定量的数据。定性数据也称品质数据 , 它说明的是事物的品质特征 , 是不能用 有一个统一单 位的数值 来表示的 ,这类数据由定类尺度和定序尺度计量形成。定量数据也称数量数据 , 它说明的是事物的数量特征 , 是能够用 有一个统一单 位 的数值 (比如, 身高可以用 cm , m 或英寸等 , 体重可以用 kg 或磅, 温度可以用 或 K ,声音的频率可以用赫兹或弧度 /秒;这里的“统一单位 ”是指对不同的变 量值都 可以使用这个单位 ,而不是一定要使用这个单位 表示的 ,这类数据由定 距尺度和定比 尺度计量形

6、成。在本质上来说 , 定性数据的取值是文字性的 , 描述性的 ; 定量数据的取值是数字 性的,度量性的。我们也经常用数字来区别定性数据 ,比如,用“ 1表”示性别为“男” , 用“ 2表”示性别为“女” ,表面上看它们也是用数字来表示的 ,但我们可以看到 ,这只是 一种规定,对应关系具有随意性 ,如果用“ 1表”示性别为“女”用 , “ 2表”示性别为“男” 也是一样可行的 ,并不会影响这个问题的结 果,就是用“ 0表”示性别为“男”用 , “ 1表” 示性别为“女”也可以。而定量数据的取值直接反映了其属性 , 是不能随便改变的 , 比如, 你说我规定用 1来表示 2, 用 2来表示 1, 那

7、你怎么来比较温度差 ? 1<2,所 以 2比 1低?再规定, 数值小表示温度高 , 这不是自找麻烦吗 ?也就是说 , 它的取 值不是可以随便规定的 (定比数据只有一个单位可以变换 , 定距数据还有一个零点 可以相对自由地定义,但这些变换都是线性变换 ,对定距数据来说 , y=kx+b,截距不为 零;对定比数据来说 , y=kx,是成比例的。同样表示身高 ,用 cm 数就是定量数据 ,用“很高、中等、不矮、矮个”来描述就 是定性数据。同样表示成绩 ,用分数就是定量数据 ,用“优、良、中、差”来描述就是 定性数据。但一般来说 , 定量的数据容易用定性的语言来描述 , 而且也多是定序的 (即使

8、不严格 ;但定性的数据就不容易用定量的语言来描述 ,定序数据还好一点 ,可以 给它规定一个对应的数值 ,比如,用绩点来代替“优、良、中、差”就 , 成了定量数 据。而要把定类数据变成定量数据就非常困难 ,原因是定类数据是无序的 , 而定量数 据无论如何都有一个自然的序关系包含在里面 (并且其差异主要都是由其数值大小 的差别决定的 ,这就是“无中生有”的难度。定性数据的取值与数字的对应关系 , 一旦做出规定 , 在使用的过程中就要保持一 致, 不能一会“ 1表”示 “男” 一, 会“ 1又”表 示“女”。 就像定量数据的单位 (以及 定距数据的零点一旦选定就必须保持一致 , 不能一部分数据这个单

9、位 , 另一个数据 用另一个单位 ,而把它们的数值拿来直接进行比较或计算。可取不同值的属性 (比如年龄、性别、身高、体重等称为变量 , 其取值即为 变量值。变量可分为连续型变量和离散型变量。 离散变量只能取有限个数 , 而且 其取值都以整位数断开 , 如企业个数、职工人数等 ; 连续变量可以取无穷个数值 , 其取值是连续不断的 ,不能一一列举 ,如零件尺寸、年龄、温度等。但实际取值时 , 连续变量往往也有可能只取整数值 , 比如履历表上的年龄、 天 气 预报的温度、 考试时的分数等。 这说明离散变量和连续变量的差别不是截然分 开 的 , 特别是在实际统计中 ,经常会有交叉。比如 , 离散变量的平均值 ,一般来说 都不 再是整数 ,像家庭中的孩子数的平均值。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1