GBT 7027-2002.pdf

上传人:哈尼dd 文档编号:3763968 上传时间:2019-09-23 格式:PDF 页数:18 大小:665.69KB
返回 下载 相关 举报
GBT 7027-2002.pdf_第1页
第1页 / 共18页
GBT 7027-2002.pdf_第2页
第2页 / 共18页
GBT 7027-2002.pdf_第3页
第3页 / 共18页
GBT 7027-2002.pdf_第4页
第4页 / 共18页
GBT 7027-2002.pdf_第5页
第5页 / 共18页
亲,该文档总共18页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《GBT 7027-2002.pdf》由会员分享,可在线阅读,更多相关《GBT 7027-2002.pdf(18页珍藏版)》请在三一文库上搜索。

1、I C S 0 11 2 0 A 0 0 噶日 中 华 人 民 共 和 国 国 家 标 准 G B / T 7 0 2 7 -2 0 0 2 代替 G B / T 7 0 2 7 -1 9 8 6 信息分类和编码的基本原则与方法 B a s i c p r i n c i p l e s a n d m e t h o d s f o r i n f o r ma t i o n c l a s s i f y i n g a n d c o d i n g 2 0 0 2 一 0 7 门8 发布2 0 0 2 一 1 2 一 0 1实施 中华人民共和国 国 家 质 量 监 督 检 验 检 疫

2、 总 局 发布 GB/ T 7 0 2 7 -2 0 0 2 目次 前言 。 1 引言 。 N 1 范 围 1 2 规范性引用文件 . 1 3 术语和定义 。 1 4 信息的分类与编码 1 4 . 1 信息分类 。 1 4 . 2 信息编码 1 5 信息分类的基本原则 。 。 2 5 . 1科学性 , 。 2 5 . 2系统性 2 5 . 3 可扩延性 , , 。 2 5 . 4 兼容性 。 2 5 . 5 综合实用性 。 2 6 信息分类的基本方法 。 2 6 . 1概述 2 6 . 2 线分类法 , , 、 、 、 、 、 、 一2 63面分类法 3 6 . 4 混合分类法 。 . 3 7

3、 信息编码的基本原则 。 。 3 7 . 1唯一性 。 3 7 . 2 合理性 。 。 3 7 . 3 可扩充性 3 7 . 4简明性 3 7 . 5适用性 3 7 . 6 规 范性 。 3 8 信息编码的基本方法 4 8 . 1 通 则 4 8 . 2 代码类型 。 4 8 . 3 代码 特征 7 8 . 4 代码表现形式 8 8 . 5 代码设计 1 0 8 . 6 代码赋值约定 n 附录A( 资料性附录) 各种信息分类编码方法的优缺点 1 2 A . 1 信息分类方法优缺点 . 1 2 A . 2各 种 类 型 代 码编 码 方 法 优 缺 点 . . . . . . . . . . .

4、 . . . . . . . 1 2 GB / r 7 0 2 7 - 2 0 0 2 前言 本标准是对GB / T 7 0 2 7 -1 9 8 6 标准化工作导则信息分类编码的基本原则和方法 的修订。 在信 息编码部分内容上, 本标准参考了国际技术报告I S O/ I E C TR 9 7 8 9 : 1 9 9 4 ( E) 信息技术数据交换 用数据元素组织与表示指南编码方法与原理 , 采纳了其中比较成熟的相关技术内容。 本标准代替 G B / T 7 0 2 7 -1 9 8 6 标准化工作 导则信 息分类 编码 的基本原则和方法 同 GB / T 7 0 2 7 -1 9 8 6 相

5、比, 本次修订所作的主要修改是: 修改了标准的名称。标准名称改为 信息分类和编码的基本原则与方法 。 标准的总体编排和结构按G B / T 1 . 1 -2 0 0 。进行了修改, 增加了目次、 前言、 引言和附录Ao 一 对原标准的内容进行 r相应的增删 增补的内容包括: 第 2 章“ 规范性引用文件” 、 第 3 章“ 术语 和定义” 和第4章“ 信息的分类与编码” 概述删除的内容是 原标准的第 2 . 4 条“ 代码的校验” 的有关 算法 。 一一对原标准的结构进行了调整: 原标准的第 1 . 1 条“ 信息分类的基本原则” 调整为第 5 章, 原标准 的第 1 . 2 条“ 信息分类的

6、基本方法” 调整为第 6 章, 原标准的第 2 . 2 条“ 编码的基本原则” 调整为第 7 章, 原标准的第 2 . 3 条“ 代码的种类” 和第 2 . 5条“ 代码的类型” 与 I S O/ I E C T R 9 7 8 9 的相关技术内容经过 整理共同构成第 8 章“ 信息编码的基本方法” , 原标准中分散叙述的各个信息分类和编码力法的优缺点 集中汇总调整为“ 附录 A各种信息分类编码方法的优缺点” 。 一对原标准中的代码名称进行了若干项调整: 原标准中的“ 特征组合码” 对应于本标准的“ 并置 码” , 原标准中的“ 复合码” 对应于木标准的“ 组合码” , 原标准中的“ 数值化字

7、母顺序码” 被本标准的“ 约定 顺序码” 所涵盖 在信息分类编码标准化领域, 本标准应与G B / 丁2 0 0 0 1 . 3 -2 0 0 1 标准编写规则第3 部分: 信息分 类编码 和GB / T 1 0 1 1 3 分类编码通用术语 两项标准配套应用。 本标准的附录A是资料性附录。 本标准由中国标准研究中心提出并归口 本标准主要起草单位: 中国标准研究中心。 本标准主要起草人 李小林、 冯卫、 胡嘉璋。 G B / T 7 0 2 7 于1 9 8 6年1 1月首次发布, 本次修订为第一次修订。 Gs/ T 7 0 2 7 - 2 0 0 2 引言 在通常情况下, 人们对信息的理解是

8、: 一切有含义的具体或抽象事物或概念的真相及相关陈述, 通 过数据、 消息及其进一步细节表达出来。 在信息分类编码领域, 信息的表现形式是数据。 客观、 明确的信息是计算机建立信息系统以及数据在其中进行交换的先决条件。 在信息系统中, 数据是用字符( 通常为数字或字母) 、 算术符号以及描述来表示, 这些表示形式应该 对其所涉及的每一个数据都有一个明确稳定的含义, 从而达到处理与交流的目的。 信息要被不同用户组或应用系统所共享 , 就必须有一致认可的定义, 举例来说, 要有概念的语义含 义( 内涵) 、 概念的全部实例( 外延) 以及一致认可的表示法。 对各类信息概念的正确理解需要依赖于信息分

9、类; 对各类信息作出一致认可的表示需要依赖于信 息编码 。 GB / r 7 0 2 7 -2 0 0 2 信息分类和编码的基本原则与方法 范 围 本标准规定了信息分类编码的基本原则和方法, 适用于各类信息分类编码标准的编制 2规范性 引用 文件 下列文件中的条款通过本标准的引用而成为本标准的条款。 凡是注日 期的引用文件, 其随后所有的 修改单( 不包括勘误的内容) 或修订版均不适用于本标准, 然而, 鼓励根据本标准达成协议的各方研究是 否可使用这些文件的最新版本。凡是不注 日期的引用文件, 其最新版本适用于本标准。 G B / T 1 9 8 8 -1 9 9 8 信息技术信息交换用七位编

10、码字符集( e q v I S O/ I E C 6 4 6 : 1 9 9 1 ) G B 2 3 1 2 -1 9 8 。 信息交换用汉字编码字符集基本集 G B / T 2 2 6 0 -2 0 0 2 中华人民共和国行政区划代码 G B / T 2 6 5 9 -2 0 0 0 世界各国和地区名称代码( e q v I S O 3 1 6 6 - 1 : 1 9 9 7 ) G B / T 4 6 5 7 -2 0 0 2 中 央党政机关、 人民团 体及其他机构代码 G B / T 7 4 0 8 -1 9 9 4 数据元和交换格式信息交换日 期和时间表示法( e q v I S O

11、8 6 0 1 : 1 9 8 8 ) G B / T 1 0 1 1 3 分类编码通用术语 G B 1 1 6 4 3 -1 9 9 9 公民身份号码 G B / T 1 3 7 4 5 -1 9 9 2 学科分类与代码 GB / T 1 4 7 2 1 . 1 -1 9 9 3 林业资源分类与代码森林类型 G B / T 1 4 8 0 5 -1 9 9 3 用于行政、 商业和运输业 电子数据交换的应用级语法规则( i d t I S O 9 7 3 5 : 1 9 8 8 ) G B / T 1 7 7 1 0 -1 9 9 9 数据处理校验码系统( id t I S O 7 0 6 4

12、 : 1 9 8 3 ) 3术语和定义 G B / T 1 0 1 1 3中确立的术语适用于本标准。 4 信息的分类与编码 4 门信息分类 信息分类是根据信息内容的属性或特征, 将信息按一定的原则和方法进行区分和归类, 并建立起一 定的分类体系和排列顺序。 信息分类有两个要素: 一是分类对象, 二是分类的依据。分类对象由若干个被分类的实体组成。分 类依据取决于分类对象的属性或特征。 信息内容属性的相同或相异, 形成了各种不同的类。在信息分类体系中, 类可称为类目。 4 . 2 信 息编码 信息编码是将事物或概念( 编码对象) 赋予具有一定规律、 易于计算机和人识别处理的符号, 形成代 码元素集

13、合。代码元素集合中的代码元素就是赋予编码对象的符号, 即编码对象的代码值。 所有类型的信息都能够进行编码 : 如关于产品、 人、 国家、 货币、 程序、 文件、 部件等各种各样的信息。 信息编码包含的内容有: 数据表达成代码的方法、 数据的代码表示形式、 代码元素集合的赋值。 信息编码的主要作用有: 标识、 分类、 参照。 G B / r 7 0 2 7 -2 0 0 2 标识的目的是要把编码对象彼此区分开, 在编码对象的集合范围内, 编码对象的代码值是其唯一性 标志; 信息编码的分类作用实质上是对类进行标识; 信息编码的参照作用体现在编码对象的代码值可作 为不同应用系统或应用领域之间发生关联

14、的关键字。 5 信 息分 类的基本原则 5 门科学性 宜选择事物或概念( 即分类对象) 最稳定的本质属性或特征作为分类的基础和依据。 5 , 2系统性 将选定的事物、 概念的属性或特征按一定排列顺序予以系统化, 并形成一个科学合理的分类体系。 5 . 3可扩延性 通常要设置收容类 目, 以保证增加新的事物或概念时, 不打乱已建立的分类体系, 同时, 还应为下级 信息管理系统在本分类体系的基础上进行延拓细化创造条件。 5 . q 兼容性 应与相关标准( 包括国际标准) 协调一致。 5 . 5 综合实用性 分类要从系统工程角度出发, 把局部问题放在系统整体中处理, 达到系统最优。即在满足系统总任

15、务、 总要求的前提下, 尽量满足系统内各相关单位的实际需要 6信息分类的基本方 法 6 . 1概述 信息分类的基本方法有三种: 线分类法、 面分类法、 混合分类法。其中线分类法又称层级分类法、 体 系分类法; 面分类法又称组配分类法。 6 . 2线分类法 6 . 2 . 1方法 线分类法是将分类对象( 即被划分的事物或概念) 按所选定的若干个属性或特征逐次地分成相应的 若干个层级的类目, 并排成一个有层次的, 逐渐展开的分类体系。 在这个分类体系中, 被划分的类目称为 上位类, 划分出的类目称为下位类, 由一个类目直接划分出来的下一级各类目, 彼此称为同位类 同位类 类目之间存在着并列关系,

16、下位类与上位类类目之间存在着隶属关系。 6 - 2 - 2示例 GB / T 1 4 7 2 1 . 1 -1 9 9 3 林业资源分类与代码森林类型 是采用线分类法, 并用五位数字代码进行 表示的。 该标准将森林类型分成三个层级, 第一层级用第一、 二位数字码表示森林植被型, 第二层级用第 三位数字表示森林类型组, 第三层级用第四、 五位数字表示森林类型。部分代码表见表 t o 表 1 代码类 型 名 称 3 0 0 0 0 3 1 6 0 0 3 1 6 1 1 3 1 6 1 2 3 1 6 1 3 3 1 8 0 0 3 1 8 1 1 3 1 8 1 2 3 1 8 1 3 经 济

17、林 饮 料 林 茶 叶 林 咖 啡 林 可 可林 鲜 果 林 苹 果 林 梨 树 林 桃 树 林 在表 1中, 经济林相对于饮料林、 鲜果林为上位类类目, 饮料林、 鲜果林相对于经济林为下位类类 Gs / T 7 0 2 7 -2 0 0 2 目, 饮料林、 鲜果林是同位类类目; 同理, 饮料林相对于茶叶林、 咖啡林、 可可林是上位类类 目, 茶叶林、 咖 啡林 、 可可林是饮料林 的下位类 类 目, 茶 叶林 、 咖啡林 、 可可林是同位类类 目。 6 . 2 . 3 要求 a )由某一 上位类划分出的下位类类 目的总范 围应 与该上位类类 目范围相等 ; b) 当某一个上位类类 目划分成若

18、 干个下位类类 目时 , 应选择同一种划分基准 ; c ) 同位类类 目之间不交叉、 不重复 , 并只对应于一个上 位类 ; d) 分类要依次进行 , 不应有空层或加层 。 6 . 3 面分类法 6 . 3 门方法 面分类法是将 所选定 的分类对象 的若干属性或特 征视为若干个“ 面” , 每个“ 面” 中又可分成彼此 独 立 的若 干个 类 目。使用时 , 可根据需要将这些“ 面” 中的类 目组合 在一起 , 形成一个复合类 目。 6 . 3 . 2示例 服装的分类可采用面分类法, 选服装所用材料、 男女式样、 服装款式作为三个“ 面” , 每个“ 面” 又可分 成若 干个类 目, 见表 2

19、 表 2 材料男 女 式 样一月 ; 装 款 式一 纯 棉 纯 毛 中 长 纤 维 男 式 女 式 中 山 装 西 服 猎 装 连 衣 裙 使用时, 将有关类目组配起来。如纯毛男式中山装, 中长纤维女式西服等。 6 . 13 要求 a ) 根据需要选择分类对象本质的属性或特征作为分类对象的各个“ 面” ; b ) 不同“ 面” 内的类目不应相互交叉, 也不能重复出现; c ) 每个“ 面” 有严格的固定位置; d ) “ 面” 的选择以及位置的确定, 根据实际需要而定 6 . 4混合分 类法 混合分类法是将线分类法和面分类法组合使用, 以其中一种分类法为主, 另一种做补充的信息分类 方 法 了

20、信息编码 的基本 原则 了 . 1 唯一性 在一个分类编码标准中, 每一个编码对象仅应有一个代码, 一个代码只唯一表示一个编码对象 了 . 2 合理性 代码结构应与分类体系相适应。 了 . 3可扩充性 代码应留有适当的后备容量, 以便适应不断扩充的需要。 7 . 4简明性 代码结构应尽量简单, 长度尽量短, 以便节省机器存储空间和减少代码的差错率 7 . 5适用性 代码应尽可能反映编码对象的特点, 适用于不同的相关应用领域, 支持系统集成 了 . 6规范性 GB / r 7 0 2 7 - 2 0 0 2 在一个信息分类编码 标准中 , 代码 的类 型 , 代码 的结 构以及 代码的编写格式应

21、当统一。 8 信 息编码的基本方法 8 门通则 编码方法应以预定的应用需求和编码对象的性质为基础, 选择适当的代码结构。 在决定代码结构的 过程中, 既要考虑各种代码的编码规则, 又要考虑各种代码的优缺点( 参见附录A) , 还要分析代码的一 般性特征, 选取合适的代码表现形式, 研究代码设计所涉及的各种因素, 避免潜在的不良后果。 代 码类型 图 1 根据代码的含义性( 参见 8 . 3 . 2条) 给出了各种常用代码的类型。 图 1 顺 序码 规则 门乙n/艺 OUCOQU 从一个有序的字符集合中顺序地取出字符分配给各个编码对象。这些字符通常是 自然数的整数, 如 以“ 1 ” 打头; 也

22、可以是字母字符, 如: AA A, A AB , AA C. . . . . . . o 8 . 2 . 1 . 2 应 用 顺序码一般作为以标识或参照为目的的独立代码来使用, 或者作为复合代码的一部分来使用, 后一 种情况经常附加着分类代码。 在码位固定的数字字段中, 应使用零填满字段的位数直到满足码位的要求 示例: 在 3 位数字字段中, 数字 1 编码为 。 0 1 , 而数字 1 5 编码为 。 1 5 0 8 . 2 . 1 . 3 类型 顺序码有三种类型: 递增顺序码、 分组顺序码、 约定顺序码。 8 . 2 . 1 . 3 门递增顺序码 编码对象被赋予的代码值, 可由预定数字递增

23、决定。 例如, 预定数字可以是 1 ( 纯递增型) , 或者是 1 0 ( 只有 1 0的倍数可以赋值) , 或者是其他数字( 如: 偶数情况下的 2 ) , 等等。 用这种方法, 代码值不带有任何含义。相类似的编码对象的代码值不作分组。 为了以后原始代码集的修改, 可能需要使用中间的代码值, 这些中间代码值的赋值根据不必按 1 递增 。 示例 GB / T 2 6 5 9 -2 0 0 0 ( 世界各国和地区名称代码 中, 部分国家和地区的数字代码( 见表 3 ) , GB / r 7 0 2 7 -2 0 0 2 表 3 招*#AAL RlSAMOA 一 一 一下 该标准中, 后来增加的地

24、区名称南极洲( A N T AR C TI C A) 使用了中间代码值。 1 0 , 属于对原始代码 集的增补。 8 . 2 . 1 . 3 . 2 系列顺序码 这种代码首先要确定编码对象的类别, 按各个类别确定它们的代码取值范围, 然后在各类别代码取 值范围内对编码对象顺序地赋予代码值。 示例: G B / T 4 6 5 7 -2 0 0 2 中央党政机关、 人民团体及其他机构代码 , 就采用了三位数字的系列顺 序码 。 1 0 0 1 9 9 表示全国人大、 全国政协、 高检、 高法机构 2 0 0 - 2 9 9 表示中央直属机关及直属事业单位 3 0 0 - 3 9 9夫示围各阵各部

25、季 7 0 0 7 9 9表7全国性人 民团体 、 民主党派机关 系列顺序码只有在类别稳定并且每一具体编码对象在目前或可预见的将来不可能属于不同类别的 条件下才能使用。 8 . 2 . 1 . 3 . 3约定顺序码 约定顺序码不是一种纯顺序码。这种代码只能在全部编码对象都预先知道并且编码对象集合将不 会扩展的条件下才能顺利使用。 在赋予代码值之前, 编码对象应按某些特性进行排列, 例如: 依名称的字母顺序排序, 按( 事件、 活动 的) 年代顺序排序等。这样得到的顺序再用代码值表达, 而这些代码值本身也应是从有序的列表中顺序 选 出的 示例: 按英文字母顺序排列的数值化字母顺序码( 见表 4

26、) 0 表 4 代码名称 0 1 0 2 0 3 0 4 A p p l e s ( 苹果) B a n a n a s ( 香蕉) C h e r r i e s ( 樱桃) D a t e s枣) 8 - 2 . 2无序码 8 . 2 . 2 . 1 规则 无序码是将无序的自然数或字母赋予编码对象。 此种代码无任何编写规律, 是靠机器的随机程序编 写的 8 . 2 . 2 . 2 应用 无序码既可用作编码对象的自身标识, 又可作为复合代码的组成部分( 复合代码的其他部分则以其 他编码规则为基础) 。 GB/ r 7 0 2 7 -2 0 0 2 8 . 2 . 3缩写码 8 . 2 - 3 . 1规则 这种代码的本质特性是依据统一的方法缩写编码对象的名称, 由取自编码对象名称中的一个或多 个字符赋值成编码表示 8 . 2 . 3 . 2应用 缩写码能有效用于那些相当稳定的、 并且编码对象的名称在用户环境中已是人所共知的有限标识 代码集。 示例

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1