1、ICS35.240CCSL6711B37山东省地方标准DB37TXXXXXXXX“产业大脑”数据仓建设指南Constructionguidelinesforthedatawarehouseofthe11industrybrain11XXXX-XX-XX发布XXXX-XX-XX实施山东省市场监督管理局发布目次前言II1范围12规范性引用文件13术语和定义14基本原则14.1 需求牵引14.2 场景赋能14.3 安全合规25总体架构26数据来源36.1 公共数据36.2 企业数据36.3 其他数据37数据能力层37.1 数据采集37.2 数据资源编目37.3 数据治理47.4 数据融合分析47.5
2、 数据存储47.6 数据共享交换57.7 数据质量管理58数据服务层68.1基础库68.2行业库78.3场景库78.4数据服务89数据仓对接810安全保障810.1安全管理810.2安全技术810.3安全运营9附录A(资料性)场景库建设示例(企业服务信息)10A.1企业服务信息10A.2基础数据表10本文件按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由山东省工业和信息化厅提出、归口并组织实施。“产业大脑”数据仓建设指南1范围本文件确立了“产业大脑”数据仓建设的基本原则,
3、提供了总体架构、数据来源、数据能力层、数据服务层、数据仓对接、安全保障等方面的指导。本文件适用于指导各行业“产业大脑”数据仓的规划和建设。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T22239GB/T35273GB/T39786GB/T43697信息安全技术信息安全技术信息安全技术数据安全技术网络安全等级保护基本要求个人信息安全规范信息系统密码应用基本要求数据分类分级规则DB37/T4646.2公共数据数据治理规范第2部分:数据清洗
4、比对3术语和定义下列术语和定义适用于本文件。3. 1数据治理datagovernance对数据进行处置、格式化和规范化的过程。注1:数据治理是数据和数据系统管理的基本要素。注2:数据治理涉及数据全生命周期管理,无论数据是处于静态、动态、未完成状态还是交易状态。来源:GB/T352952017,2.1,433.2数据标准datastandard数据的命名、定义、结构和取值范围方面的规则和基准。来源:GB/T363442018,2.84基本原则4.1 需求牵引“产业大脑”数据仓建设宜以产业发展需求为牵引,推动公共数据、企业数据、其他数据等多方数据汇聚。4.2 场景赋能宜通过规范“产业大脑”数据仓数
5、据米集、编目、治理、融合分析、存储、共享交换和质量管理,以知识、规则、模型、算法等方式赋能产业服务和场景。4.3 安全合规宜采取措施保护“产业大脑”数据仓中数据不被非法访问、修改或删除。5总体架构“产业大脑”数据仓宜整合产业相关数据,实现产业数据的采集、编目、治理、融合分析、存储、共享交换和质量管理,是“产业大脑”的核心组成部分和数据底座。“产业大脑”数据仓宜包括数据能力层、数据服务层、安全保障,“产业大脑”数据仓架构见图1。a)数据能力层:作为支撑产业数据处理的核心层,宜具备数据资源采集、编目、治理、融合分析、存储、共享交换和质量管理等能力。b)数据服务层:官通过对数据仓汇聚的原始数据进行数
6、据治理、融合,构建形成基础库、行业库和场景库,同时汇聚各类知识、规则、模型、算法,为各类场景应用提供服务支撑。c)安全保障:宜为数据仓提供安全管理、安全技术和安全运营等支撑。应用支撑TT政府侧场景应用行业侧场景应用Tr“产业大脑”数据仓模型算法基础库行业库数据服务层企业基本I信意一经营风险LjtiLJ产业发展L信息一产业图谱一信息一上游企业J信息一科技创新.信息一精准招商J信息、J企业迁移-信息一知识规则场景库企业采购信息L企业服信息工信息J生产设、备信息一质量控-制信息二环境与合规信:运输与|物流信三安全保障数据来源公共数据企业数据其他数据数据采集数据资源编目数据治理数据融合分析数据能力层数
7、据存储数据共享交换数据质量管理图1“产业大脑”数据仓架构6.1 公共数据6.1.1 宜通过省一体化大数据平台,根据业务需求申请政府侧相关产业基础数据,包括但不限于企业基础数据、公共资源交易数据、科技创新数据、金融综合服务数据、政策人才数据。6.1.2 企业基础数据宜包括但不限于企业的登记信息、存续状态数据。6.1.3 公共资源交易数据宜包括但不限于公共资源交易平台上的交易数据,如政府采购、土地拍卖、工程招投标数据。6.1.4 科技创新数据宜包括但不限于科技创新项目申报、科研成果、专利申请和授权数据。6.1.5 金融综合服务数据宜包括但不限于信贷记录、融资情况、保险业务数据。6.1.6 政策人才
8、数据宜包括但不限于税收政策、环保政策、贸易政策、鼓励性政策、行业规范、限制性措施、人才基本信息数据。6.2 企业数据6.2.1 2.1宜通过产业链上下游企业许可范围内的合规数据共享交换获得企业运营、供应链等数据。6.2.2 企业运营数据宜包括但不限于以下内容。a)企业资源计划数据:物料需求计划、库存状态、生产计划、财务信息、人力资源数据。b)客户关系管理数据:企业的客户信息、销售记录、售后服务数据。c)制造执行数据:生产计划调度、生产进度跟踪、质量控制数据。6.2.3 供应链数据宜包括但不限于以下内容。a)供应链上下游企业数据:供应商的生产能力、质量水平、交货周期数据。b)商品贸易和流通环节数
9、据:进出口贸易数据、物流运输数据。c)链主企业的招投标数据。6.2.4 企业的其他数据宜包括但不限于知识产权、标准、企业认证和资质数据。6.3 其他数据宜通过互联网及其他资源渠道搜集获取电信运营商、行业协会、研究机构等第三方行业数据,包括但不限于互联网的新闻资讯、社交媒体信息、产品市场信息、行业从业机构信息,以及行业研究机构、咨询公司等提供的市场分析报告、行业研究报告。7数据能力层7.1 数据采集7.1.1 “产业大脑”数据仓宜具备数据采集能力,支持多源数据采集,包括物联网设备、社交媒体、交易系统等,并实施自动化数据采集流程,支撑数据的高效集成。7.1.2 数据采集能力宜包括数据源管理、数据抽
10、取、数据转换、采集任务调度、元数据管理、采集监控等。7.2 数据资源编目7.2.1 “产业大脑”数据仓宜具备数据资源编目能力,实现数据资源的统一编目和管理,为“产业大脑”、各业务系统提供数据资源清单。7.2.2 数据资源编目能力宜包括数据资源目录编制、数据资源审核发布、数据资源挂载、数据资源目录查询、数据资源目录变更、数据资源停用等。7.2.3 数据资源目录内容宜包括但不限于数据资源名称、数据资源代码、数据资源提供方、数据资源分类、行业分类、行业代码、行业内企业共享属性、跨行业企业共享属性、数据安全级别、开放属性、数据资源格式和类型、更新频率、发布日期、数据资源摘要。7.3 数据治理7.3.1
11、 “产业大脑”数据仓宜具备数据治理能力,建立各行业数据治理规范,包括元数据标准、数据清洗比对标准等,对行业数据进行标准化和清洗比对。7.3.2 数据标准化宜具备标准创建、标准修改、标准删除、标准查询、标准详情查看、标准导入导出、标准质量检查、标准版本管理、标准模板管理、标准变更订阅等能力;数据标准信息包括但不限于数据标准代码、数据标准名称、数据标准类型、长度、精度、数据标准描述。7.3.3 数据清洗比对宜具备清洗比对规则自定义与配置、数据过滤、数据比对、数据去重、数据补全、数据转化、数据降维、清洗任务管理等能力;清洗比对规则包括但不限于特定字符转换、大小写转换、汉语转拼音、同义词替换、规则校验
12、数据清洗比对宜参照DB37/T4646.2o7.4 数据融合分析7.4.1 “产业大脑”数据仓宜具备数据融合分析能力,通过数据模型管理、数据血缘分析、数据标签管理、数据融合分析,开发逻辑模型、物理模型,形成基础库、行业库和场景库,提供数据服务。7.4.2 4.2数据模型管理宜提供以逻辑模型创建物理模型能力,使物理模型继承逻辑模型定义的数据结构、约束和数据关系等。逻辑模型宜支持按照业务拆分主题域,并进行主题域内的数据逻辑结构、约束和数据关系设计,实现业务模型定义;物理模型宜包含模型物化和模型加工两部分能力,模型物化宜创建物理模型定义的表结构,模型加工宜在线定义模型的加工逻辑,并支持垂直拆分、水
13、平拆分、多表联合、多表连接或自定义映射等方式。7.4.3 数据血缘分析宜提供数据血缘分析和展示能力,支持数据源库到目标数据库之间流向查看,库级、表级和字段级血缘分析,数据血缘信息展示;基于数据血缘信息,宜提供溯源分析、影响分析、关联程度分析和数据时效性分析等元数据应用分析能力;支持数据流动趋势、数据库间依赖关系和数量的展示。7.4.4 数据标签管理宜提供数据标签体系建设和管理能力,开展数据标签规则建立、标签开发、标签生命周期管理,形成数据标签库,提供数据分类标注和分级标注等服务,数据标签宜具备标签地图、标签申请、标签数据预览、标签元数据查询、标签应用等,支持指标统计分析、标签的开发与运维、标签
14、使用情况监测。7.4.5 数据融合分析能力宜提供跨数据源的数据分析、融合和提取,形成面向业务和应用的数据集;支持基础统计分析、数据挖掘算法应用、多维分析等能力。7.5 数据存储7.5.1 “产业大脑”数据仓宜支持存储结构化数据、半结构化数据、非结构化数据等。7.5.2 宜采用不同的存储方式存储数据仓不同类型的数据,存储方式包括但不限于以下方式。a)传统关系型数据库:存储结构化数据,适用于少量存储数据,提供事务支持、数据一致性和完整性保障。b)分布式关系型数据库:存储结构化数据,适用于处理大规模的数据集,并提供高性能的查询能力。c)列式关系型数据库:存储结构化数据,适用于大规模数据的OLAP场景
15、d)时序数据库:存储结构化数据,适用于存储物联网传感器数据、金融市场数据、应用性能监控等数据。e)文档数据库:存储半结构化数据,适用于以文档作为数据存储和操作基本单元的场景。f)分布式文件系统:存储非结构化数据,适用于以文件形式分散存储在多台独立服务器的场景;g)对象存储:存储非结构化数据,适用于云计算环境。7.5.3 宜制定数据备份策略,确保数据的备份频率、备份方式、备份介质等符合业务需求。备份策略包括但不限于全量备份、增量备份、差异备份。7.5.4 宜制定数据恢复策略,确保在数据丢失或损坏的情况下能够快速恢复数据。恢复策略包括但不限于全量恢复、增量恢复、差异恢复。7.6 数据共享交换7.
16、6.1“产业大脑”数据仓宜根据数据的时效性、数据量等情况确定数据共享交换方式,数据共享交换方式包括但不限于以下方式。a)数据库表方式:数据供给方将“产业大脑”数据仓中的数据推送到共享数据库中,数据需求方从共享数据库中获取数据,适用于数据时效性较低、共享交换的数据量较大的情况,主要能力包括数据源管理、数据字段映射、数据字段预处理、数据推送。b)接口方式:数据供给方通过接口方式提供共享数据,适用于数据时效性较高、共享交换的数据量不大的情况,主要能力包括接口注册、接口代理、接口鉴权、接口流控。c)文件方式:数据供给方将数据以文件为载体共享给数据需求方的方式,适用于数据时效性较低、数据对接双方隔离性较
17、高的情况,主要能力包括文件源管理、文件清单管理、文件下载、文件上传。d)标识解析方式:数据供给方将数据仓数据在工业互联网标识解析二级节点注册,通过标识映射数据仓IP地址,数据需求方通过标识解析实时获取数据。e)区块链方式:利用区块链技术的分布式、不可篡改和加密特性,实现数据的安全共享交换,如交易信息、税务信息等,适用于数据时效性较低、共享交换的数据量较少、安全性较高的情况。7.6.2宜采用同步机制来确保“产业大脑”数据仓数据的一致性、完整性,同步机制包括但不限于以下内容。a)全量同步:每次同步都会将所有数据都同步到目标端,适用于数据量不大、完整性较高、数据更新不可控的情况。b)增量同步:只同步
18、自上次同步以来发生变化的数据,适用于时效性较高、同步效率较高、资源占用较低的情况。c)比对同步:比较源端和目标端之间的数据差异,然后将差异数据同步到目标端,适用于数据量较大、时效性较低、数据更新不可控的情况。7. 6.3宜采用的数据同步方式包括但不限于实时同步、周期性同步、条件触发同步。7.7数据质量管理7. 7.1“产业大脑”数据仓宜建设数据质量管理能力,包括但不限于数据规则管理、数据质量检查、数据质量分析评价、数据质量报告生成、问题数据工单管理、数据质量监控与改进能力。8. 7.2宜根据行业数据实际情况,制定数据质量管理流程,包括但不限于:a)数据采集阶段,制定数据采集规范和验证规则;b)
19、数据清洗阶段,识别和处理数据中的错误、缺失值和异常值;c)数据转换阶段,使用数据转换规则和映射表,确保数据在不同系统或格式之间的转换正确无误;d)数据验证阶段,使用数据验证工具和技术对数据进行验证。8数据服务层9. 1基础库1.1.1 “产业大脑”数据仓宜建设基础库,将行业内企业基本信息、经营风险信息、上游企业信息、客户信息等基础信息进行归类和整合。1.1.2 企业基本信息宜包括但不限于以下内容。a)企业工商信息:企业名称、统一社会信用代码、企业法人、成立日期、企业官网、企业简介、经营范围、电话、电子邮箱、注册资金(万元)、实缴资本(万元)、纳税资质、企业类型、经营期限开始日期、经营期限结束日
20、期、注册详细地址、登记机关、登记证号、参保人数、人员规模、登记状态。b)企业专利信息:企业名称、统一社会信用代码、专利名称、专利摘要、专利类型、专利状态、专利申请号、专利申请人(机构)、申请日期、申请人地址、专利分类号、发明人、公开公告号、公开公告号日期、是否国际专利、代理机构、代理人。c)企业商标信息:企业名称、统一社会信用代码、商标名称、商标图案(URL)、商标注册号、商标状态、商标或服务项目、申请人地址、申请人、申请日期、代理机构、国际分类编码、国际分类名称、注册公告日期。d)软件著作权信息:企业名称、统一社会信用代码、软件全称、软件简称、版本号、登记号、开发完成日期、首次发布日期、登记
21、日期、权利取得方式。e)对外投资信息:企业名称、统一社会信用代码、被投资企业名称、企业状态、企业法人、注册资金(万元)、成立日期、持股比例、认缴出资额、认缴出资日期、最终受益股份、所属行业、投资数量、关联产品或机构。f)创投融资信息:企业名称、统一社会信用代码、融资日期、融资轮次、融资金额、企业估值、投资方。g)股权质押信息:企业名称、统一社会信用代码、质押人、质押人参股企业、质押权人、质押股份总数(股)、质押股份市值(元)、质押状态、公告日期。h)网站备案信息:企业名称、统一社会信用代码、网站地址、网址、域名、网站备案或许可证号、审核日期、备案域名、公安备案号、备案地公安机关、备案日期、网站
22、类型。D企业荣誉信息:企业名称、统一社会信用代码、荣誉名称、荣誉编号、荣誉类别、荣誉级别、发布单位、发布日期、有效期自、有效期至。J)企业资质证书信息:企业名称、统一社会信用代码、证书名称、资质类别、资质等级或产品名称、证书编号、发证日期、发证机构、有效期至、证书状态。1.1.3 经营风险信息宜包括但不限于以下内容。a)司法案件信息:所属企业、统一社会信用代码、案件名称、案件类型、案件日期、案由、案件进程、案件身份、案号、法院、案件金额(元)。b)限制高消费信息:所属企业、统一社会信用代码、案号、限消令对象、限制法定代表人、申请人、涉案金额(元)、执行法院、立案日期、发布日期。c)行政处罚信息
23、所属企业、统一社会信用代码、决定文书号、违法事实、处罚结果、处罚金额、处罚单位、处罚日期。d)被执行人信息:所属企业、统一社会信用代码、案号、被执行人、执行标的(元)、执行法院、立案日期。e)失信被执行人信息:所属企业、统一社会信用代码、案号、失信被执行人、疑似申请执行人、涉案金额(元)、执行法院、立案日期、发布日期。1.1.4 上游企业信息宜包括但不限于企业名称、统一社会信用代码、供应商、供应商状态、采购金额、报告期或公告日期。1.1.5 客户信息宜包括但不限于企业名称、统一社会信用代码、客户、客户状态、销售金额、报告期或公告日期。8.2 行业库8.2.1 “产业大脑”数据仓宜建设行业库,
24、行业库包括但不限于产业发展信息、产业图谱信息、科技创新信息、精准招商信息、企业迁移信息。8.2.2 产业发展信息宜包括但不限于产业大脑代码、产业规模、产业聚集度、国家级奖项清单(集群名称、认定机构、认定时间)、省部级奖项清单(集群名称、认定机构、认定时间)、省十强“雁阵形”集群情况、省特色产业集群情况、省战略性新兴产业集群情况、其他省级荣誉清单(集群名称、认定机构、认定时间)。8.2.3 产业图谱信息宜包括但不限于产业大脑代码、产业链名称、产业链节点名称(如微纳传感器产业链,上游铜原材料供应和芯片设计(一级节点名称)-传感器制造(二级节点名称)-传感器应用(三级节点名称)、产业链节点关联企业名
25、称、产业链节点关联企业统一社会信用代码。8.2.4 科技创新信息宜包括但不限于产业大脑代码、科创平台(平台名称、关联企业名称、关联企业统一社会信用代码)、产学研项目(项目名称、关联企业名称、关联企业统一社会信用代码)、高层次人才(人才姓名、学历层次、关联企业名称、关联企业统一社会信用代码)、专业技能人才(人才姓名、关联企业、关联企业统一社会信用代码)、晨星工厂(企业名称、企业统一社会信用代码)。8.2.5 精准招商信息宜包括但不限于产业大脑代码、招商项目名称、关联产业链节点、关联企业、投资金额(元)、签约状态、项目进度。8.2.6 企业迁移信息宜包括但不限于产业大脑代码、关联产业节点、迁移类型
26、入或出)、迁移概率。8.3 场景库8.3.1 “产业大脑”数据仓宜建设场景库,根据行业内企业的业务需求和场景需求,将数据划分成若干相对独立的业务域进行分阶段建设,形成满足特定场景需求的场景库。8.3.2 场景库宜包括但不限于企业采购信息、企业服务信息、企业库存信息、生产设备信息、质量控制信息、环境与合规信息、运输与物流信息,以企业服务信息为例,场景库建设示例见附录A。8.3.3 企业采购信息宜包括但不限于产业大脑代码、企业名称、统一社会信用代码、商品一级和二级分类名称和编码、商品编码、商品名称、采购时间、商品单位、采购数量、采购单价、原价金额、实付金额、采购状态、采购单位名称、供应商编码、供
27、应商名称。8.3.4 企业服务信息宜包括但不限于产业大脑代码、企业名称、统一社会信用代码、服务代码、服务名称、服务流程、服务资质要求、服务人才需求、服务交付成果、服务内容、服务报价。8.3.5 企业库存信息宜包括但不限于产业大脑代码、企业名称、统一社会信用代码、物品编号、物品单位、物品数量、周转率、库房位置。8.3.6 生产设备信息宜包括但不限于产业大脑代码、企业名称、统一社会信用代码、设备编号、设备名称、设备型号、月生产能力、月使用率、月空闲时段、使用状态、采购日期、报废年限。8.3.7 质量控制信息宜包括但不限于产业大脑代码、企业名称、统一社会信用代码、产品编码、产品名称、质量标准、检验方
28、法、检验时间、检验结果、检验记录、检验机构。8.3.8 环境与合规信息宜包括但不限于产业大脑代码、企业名称、统一社会信用代码、记录日期、检查内容(检查项目、检查标准、检查方法、检查结果)、数据记录(监测数据、监测日期、监测人员、监测设备)、判定结果、判定依据、判定日期、判定人员、整改要求、整改期限、整改结果、复查日期。8.3.9运输与物流信息宜包括但不限于产业大脑代码、企业名称、统一社会信用代码、所属企业、运输时间、运输费用、送达时间、发货地、目的地、物流公司名称、物流公司所在地、运输货物(货物名称、单位、数量)。8.4 数据服务宜结合政府侧及企业侧应用场景需求,基于已有的基础库、行业库、场景
29、库数据,采集场景应用所需的其他数据,对场景相关数据治理融合后进行封装,为应用场景提供数据产品或应用支撑能力,通过接口等方式支撑“产业大脑”和行业内各企业的业务决策和分析需求,数据产品或应用支撑能力包括但不限于知识、规则、模型、算法。9数据仓对接“产业大脑”数据仓宜具备数据资源对接能力,统一规范数据接口类型、协议、文档等内容,并提供数据资源调用接口,满足数据仓之间、数据仓与其他应用系统之间的数据资源调用,数据接口其他内容可参照DB37/T4225O10安全保障10.1安全管理10.1.1 宜建立数据安全管理机制,制定数据安全制度规范,明确数据安全管理目标、原则、责任边界等。1.1.1 1.2宜建
30、立统一身份认证机制,对对接双方的身份进行认证,确保对接双方身份的真实性,保证仅授权方可以进行对接活动,统一身份认证机制内容包括但不限于:a)对数据仓对接双方进行双向身份鉴别,保证对接双方身份的真实性;b)在安全周期范围内对对接双方定期重新认证;c)涉及交换敏感数据时,双方采用密码技术(如数字证书)进行身份鉴别;d)涉及多方对接时,对各接入方进行交叉认证。1.1.3 3宜建立数据使用过程的责任机制和评估机制,防止数据资源被用于不正当目的。1.1.4 4宜建立数据灾备系统和机制,制定数据灾备策略和应急计划,定期进行灾备的演练和测试。1.1.5 5宜建立数据销毁机制,采用数据销毁、存储媒体销毁等方式
31、实现数据的有效销毁。1.1.6 6宜建立数据安全审计机制,对重要行为和重要安全事件进行安全审计,定期对审计记录进行分析和结果记录,审计内容包括但不限于数据申请审批、库表数据交换、接口调用。1.1.7 7网络安全等级保护宜符合GB/T22239,宜通过商用密码应用安全性评估,个人信息安全宜符合GB/T35273010.2 安全技术10.2.1 宜按照GB/T43697制定数据分类分级规则,按照各行业数据需求,对数据进行分类分级管理,重点对重要数据、核心数据进行识别和分级保护。10.2.2 宜采用符合GB/T39786的密码技术,对数据进行加密保护;根据应用需求保留敏感数据的原格式、属性或关联,
32、并对脱敏操作进行记录。10.2.3 宜建立数据脱敏安全策略,对敏感数据进行匿名化、去标识化等脱敏处理,屏蔽敏感信息。10.2.4 宜对“产业大脑”数据仓的数据采取加水印的方式实现数据溯源管理和版权确认。10.2.5 数据分析过程宜采取适当的安全控制措施,如差分隐私保护、K匿名等,防止数据挖掘、分析过程中有价值信息和个人隐私泄漏的安全风险。10.2.6 对于涉及产业数据中的特定级别敏感数据的共享交换,宜采用数据可用不可见技术。10.3 安全运营10.3.1 宜开展数据安全风险监测,建立数据安全事件应急响应机制,制定应急响应流程。10.3.2 宜开展数据安全巡检自查,采用手工巡检、脚本化巡检和平台
33、化巡检相结合的方式,对数据仓的可用性、可靠性和性能进行综合评定。10.3.3 宜采用数据仓事务与日志记录、数据仓审计、数据备份与还原、数据可视化与报表等方法,对数据采集、治理、处理、分析、共享交换和应用等数据全流程进行溯源管理提高数据质量。10.3.4 宜定期开展数据仓安全漏洞评估,从数据、网络、应用程序等方面进行全面的安全检测,及时发现并修复潜在的安全隐患。10.3.5 宜开展数据安全培训工作,培训内容包括数据仓安全基础知识、安全操作规范、应急响应流程等。附录A(资料性)场景库建设示例(企业服务信息)A.1企业服务信息企业服务信息基础数据包括服务注册信息,提供服务的企业信息,服务交易信息等。
34、企业服务数据可先由行业头部企业实际业务数据导入,后续可由行业内各企业主动录入或批量调取等方式补充并动态维护,主要服务形式包括:a)按服务名称、服务内容等构建查询接口,为需要服务的客户提供主动公开的服务列表或服务检索;b)对已有企业服务数据进行分析,统计提供不同服务的企业数量、服务交易量,对比服务价格、服务评价等信息,帮助客户择优选择服务企业;c)根据服务资质、人才需求等信息,过滤选择不同等级的服务内容及服务企业,对行业企业及人才进行分类统计,研究行业发展规律,赋能产业高质量发展;d)根据用户使用情况和数据采集量,搭建企业服务交易平台,为服务供需双方提供在线交易提供支持,并在交易业务中不断丰富数
35、据,提供行业数据统计查询服务等。A.2基础数据表以服务注册信息表、企业服务信息表、服务交易信息表为例,“产业大脑”数据仓通过数据采集能力将数据从数据源抽取到数据仓中,经过数据清洗、比对等数据治理工作后,形成服务注册信息表(见表A.1)、企业服务信息表(见表A.2)、服务交易信息表(见表A.3)。表A.1服务注册信息表字段代码字段名称字段类型备注ServiceJD服务ID号字符型系统主键MindCode产业大脑代码字符型OrgName企业名称字符型UnifiedIdentifier统一社会信用代码字符型Service_code服务代码字符型Service_name服务名称文本Service_pr
36、ocess服务流程文本宜另附附件形式挂接具体流程图等Service_qualifications服务资质要求文本通过分隔符列示多个,资质名称宜另设计字典表或资质明细表Service_talents服务人才需求文本提供该服务的人才基本技能需求或资质认证需求Service_deliverables服务交付成果文本该服务最终交付成果(清单)Service_content服务内容文本该服务的简介、价值等Service_quotation服务报价文本该服务的成本组成、行业价格计算等表A.2企业服务信息表字段代码字段名称字段类型备注ComSerJD企业服务ID号字符型系统主键MindCode产业大脑代码字
37、符型OrgName企业名称字符型UnifiedIdentifier统一社会信用代码字符型ComSer_Service_name企业服务名称文本“服务注册信息表”的服务名称ComSer_Service_URL企业服务链接字符型企业服务的网络URL或其他业内可理解的服务提供渠道说明ComSer_Customer_service企业客服信息字符型企业服务的联系方式,如:联系人、电话、邮件等信息表A.3服务交易信息表字段代码字段名称字段类型备注Ser_Transaction_ID服务交易ID号字符型系统主键MindCode产业大脑代码字符型Ser_Provider服务供方文本提供服务单位的名称UnifiedIdentifier服务供方统一社会信用代码字符型Ser_Team服务团队文本给出团队成员描述Ser_Demander服务需方文本被服务单位名称UnifiedIdentifier服务供方统一社会信用代码字符型Ser_Procurementtime服务采购时间日期服务采购或开始的时间Ser_Continue服务持续时间文本提供服务的时间区间Ser_Endtime服务结束时间日期服务结束或终止的时间参考文献1 GB/T35295-2017信息技术大数据术语2 GB/T36344-2018信息技术数据质量评价指标3 DB37/T4225政务信息资源数据服务接口规范