1、XX市XX医院分类分级数据脱敏采购项目采购需求一、采购内容及需求(一)项目概况数字经济大潮下,随着智慧医疗的纵深化发展,医疗数据安全作为关系到生命安全与智慧医院建设成效的关键因素,其重要性不言而喻。中共中央、国务院印发的“健康中国2030”规划纲要中明确要求各医疗机构需“注重内容安全、数据安全和技术安全,加强健康医疗数据安全保障和患者隐私保护。止匕外,2022年国家卫生健康委、国家中医药局、国家疾控局印发的医疗卫生机构网络安全管理办法中也对数据安全做出了进一步能力要求,要求各医疗机构从组织架构、制度优化、能力建设、资产管理等维度出发,构建起数据安全能力体系。除政策层面的行业标准越发严格外,信息
2、系统在支撑着医院数字化转型业务高效运转的过程中也对数据安全提出新的要求。目前数据安全建设主要存在以下难点,一是缺乏统一数据标准,制约诊疗服务水平进一步提升;二是数据共享管理混乱,存在泄露风险;三是数据安全建设难度较大,改造尺度难以把握;四是数据质量差影响业务使用效率;五是数据敏感度高,数据防护与应急处置压力较大;六是内部人员权限管理过于粗放,管理制度还需完善。医院数据安全建设思路可以归纳为八个字,即“分级保护,技管并重”。一方面,需要对不同级别、不同类别的数据分别设计策略并进行管理,另一方面需要通过技术与管理手段构建起体系化的数据安全能力,实现数据全生命周期的“可视”“可管”“可控”。XX市X
3、X医院作为一所国家三级甲等综合性医院,近年来在信息化建设方面取得了显著成就。随着医院业务的不断拓展和医疗技术的不断进步,医院积累了大量的患者数据、医疗影像资料、电子病历等敏感信息。这些数据不仅是医院运营和临床决策的重要依据,也是患者个人隐私的重要组成部分。因此,确保这些数据的安全性成为医院信息化建设的重要任务。本项目针对核心数据进行脱敏及进行数据的分类分级,需采购信息化设备一批,设备参数详见如下:(二)详细技术参数1.数据安全分类分级平台技术指标要求(1套)类别指标项详细功能要求产品功能系统架构基于AI智能化技术,动态发现并精准识别国家、组织、和个人安全的各类分级数据,形成符合行业诉求的数据资
4、产目录,以满足数据安全合规利用及精细化安全防护诉求。支持关系数据库,CSV、XLS.JSON.XML.TXT文件等资产类型。支持对系统运行资源进行监控;支持在银河麒麟V10、统信UOSLinux红旗7.0、Ubuntu22.X、龙蜥AnolisOSCentOS7及以上版本操作系统环境部署;提供满足本项目算力资源,关系数据库资产按实例数计算,文件资产按文件类型数计算;内置包含且不限于通义千问2.5、DeePSeek等大模型;数据源类型支持多种数据源类型,包括关系型数据库、非关系型数据库、国产数据库、大数据库和多种类型的文件;关系型数据库包括OracleMySQL、SQLServer、Postgr
5、eSQLMariaDB、MongoDBCacheDB2;支持国产数据库,包括人大金仓、达梦、华为GaUSSDB、巨杉、星环、OceanBaseTDSQLTiDB高斯、Gbase8a8t8sVastbase等国产数据库;大数据库包括但不限于HiveTDHHbaseArgoDBFusionInsightHive、Presto、MaxComputeImpala;支持LDAP、kerberosUsername等认证方式;支持通过zookeeper连接数据源;云数据库包括但不限于RDS_MySQL、RDS_SqlServer,RDS_PostgreSQL,ads,PolarDBMySQL,PolarDB
6、Oracle等;非关系型数据库包括:redisMongoDBElasticsearch等;文件类型至少包括txt、csv、xlsxlsxjsonxmlhtml等;支持上传压缩文件,实现数据源导入;支持通过FTP/SFTP/LOCAL文件协议对csv、txt等文件进行数据解析;重要数据清单扫描识别组织中存在的重要数据并形成清单,支持人工审核及领导审批流程,支持本地文件导出、支持重要数据分类与安全标签级别修改。重要数据上报功能按照卫生健康行业数据分类分级指南中的模板格式要求生成相应上报报表,支持按年份手工确认与调整,支持历年上报结果查询,支持本地文件导出。数据源管理支持通过手动、批量导入等多种方式
7、新增数据源;支持将数据源关联至所属部门、业务系统和责任人;支持通过IP端口扫描等方式自动发现数据源;支持实时展示数据源发现作业执行状态和发现结果,包括开始时间、作业用时、发现数据库的数量、发现的数据源清单等;支持集中管理业务系统,包括业务系统的名称、描述以及绑定的数据源等;支持通过业务系统视角查看对应数据的分类分级结果;数据字典管理支持数据字典管理,可通过扫描数据库表结构信息,进行数据字典采集;实时展示数据字典采集同步状态;支持通过产品界面手动编辑或批量导入等方式新增数据源表注释、字段注释,丰富数据字典信息;表、列数据字典采集结果支持在线检索或一键导出至本地;标准规则管理符合卫生健康行业数据分
8、类分级指南和国家卫生信息资源分类与编码管理规范(WS/T787-2021)的分类分级标准;支持政策依据管理;支持政策文件导入与在线更新;支持通过现有安装的软件版本对内置的分类分级规则与算法内容包进行在线更新,而无需进行整个系统升级更新;分类分级算法与智能化系统内置专业完善的主数据和识别规则,支持手工自定义主数据,并添加相关识别规则,规则识别对象包括:列内容匹配、列注释匹配、字段名匹配等;识别方式包括正则、自定义代码和语义相似度匹配等;支持根据数据特征自动选用语义识别策略,以提升识别准确率。支持自动选择合适的算法策略:如字段注释比较充足时可使用注释理解策略;数据特征比较明显时可使用规则匹配来识别
9、字段命名方式是英文单词的可使用智能翻译和大模型能力;字段命名方式为拼音缩写或全拼时可使用智能拼音和大模型等能力等;一个主数据支持多条识别规则;支持为主数据识别规则设置可信度和阈值,可信度越高的规则识别结果,可优先作为候选项,低于阈值的不做采纳;支持对识别进行优先级配置,优先级越高的识别规则越先执行,以提升识别效率;支持展示分类分级作业相关效率,通过NLP翻译、LLM大模型、特征工程等技术,为字段匹配主数据;支持将字段名称语义化后的信息、字段注释通过NLP技术自动匹配,以及将数据内容经特征工程分析后匹配数据业务术语;支持利用已确认的分类分级结果数据进行学习建模,支持通过LoRA等技术手段对基础
10、模型进行微调,以提升用户专业数据识别能力;支持根据语义向量模型进行语义相似度的计算,实现数据自动分类;支持通过本地专业知识库、embedding模型、多节点多专家工作流拓展NLP大模型能力,进行语义推理和智能数据分类;支持以数据集/数据表为单位进行分类和分级,而非仅仅对各个字段的识别或字段识别的简单叠加;(提供相对应的证明材料或知识产权备查)分类分级功能所有数据源支持按照国家卫健委统一标准,输出对应的分类分级结果;支持全量识别、按系统识别、自定义识别等多种操作方式,可按照库、表等不同细粒度确定数据范围;支持按样本限制数随机抽取一定数量的样本数据进行识别;静态数据库表数据分类分级,支持以数据集的
11、形式自动扫描业务系统数据,按规则库和用户自定义数据集规则进行自动化识别且生成分类分级自评估报告;流动数据分类分级,支持通过自定义数据集形式包括多表关联组合等方式创建临时数据集进行识别且生成报告,并同时识别数据集中是否存在重要数据。非标数据分类分级,支持电子表格、XML.JSoN等格式非标准数据集进行识别且生成报告,并同时识别数据集中是否存在重要数据。人工审核纠错确认,系统自动识别评估的分类分级结果可以人工审核、修改、纠错,审核时可以查看样本数据,审核过程系统将自动记录可追溯;识别结果依据可查看,分类分级结果中可以查看每个数据集评估结果的依据,包括政策依据和主要算法依据,实现识别评估过程可视化;
12、字段级管理,支持以字段为单位管理安全标签,包括用户数据源数据字典和标准主数据;支持以字段为单位管理和指定安全措施;数据合规数据评估,依据数据分类分级识别结果生成数据集分类分级自评估报告,系统应支持专用安全介质方式由专业法务团队审核并出具法律意见书;生成的数据集分类分级自评估报告同时支持报告导出;数据分类分级自评估报告应支持模板自定义。数据使用,依据数据分类分级识别结果生成数据集使用协议约定,自动生成的数据集使用协议约定同时支持报告导出;数据集使用协议约定应支持模板自定义;不可篡改性,支持通过区块链技术,将数据共享的全流程及关键修改信息、审核信息上链存证,确保数据共享的可追溯性和不可篡改性。分类
13、分级结果展示支持从数据源视角、业务系统视角,查看分类分级结果;支持进一步从表、字段视角,查看分类分级结果,并支持导出结果至本地;可从数据表视角,查看表格使用的分类分级标准,以及其所属的分类、安全级别、字段总数、空字段数等信息;依据分类分级评估识别情况生成展示报告,多维度全面展示本次评估汇总情况,包括本次评估的数据源范围、包含的数据库表与数据集情况、其中核心数据、重要数据和一般数据的分布情况,以及根据行业规范的数据分类情况等,应可从汇总结果查看细节详情,可选择保存到本地;支持汇总展示所有的分类分级结果,并按时间排序;支持根据识别类型、数据表等快速检索,方便进行操作追溯;分类分级自评估报告支持全局
14、或按照单个数据源或自定义数据集视角,对分类分级结果进行统计分析,输出分类分级自评估报告;分类分级自评估报告支持在线查看,也可通过PDF、WORD、OFD等多种格式导出保存到本地;分类分级大屏可按客户实际需求提供自定义的分类分级结果可视化大屏;自动分级按数据安全法与行业主管部门的数据分类分级要求,以数据集为单位,采用人工智能大语言推理模型将数据自动分为三级,并支持手工审核纠错;自动分类按国家卫生信息资源分类与编码管理规范(WS/T787-2021)对业务数据分类的要求,以数据集为单位,采用人工智能大语言推理模型自动将所有数据打上分类标签,并支持手工审核纠错;权限控制支持按数据权限、功能权限配置不
15、同的角色可操作的数据和功能范围;数据看板数据资产地图支持数据分类分级完后的数据集以树状目录形态进行数据资产管理;数据对比支持业务系统数据库中的数据以周、月、季、年为统计周期,精准核算各周期数据的增减幅度,并将统计结果以表格或图形的形式直观呈现,便于用户清晰掌握数据动态变化趋势,为决策提供有力依据;产品联动分类分级接口提供数据源列表获取、分类分级标准列表获取、作业信息获取、分类分级结果获取等各类标准接口及相关接口文档;系统提供标准APl接口,支持与第三方安全产品实现联动,提供分类分级评估结果输出。数据脱敏模块脱敏方式支持文件到文件、库到文件与库到库脱敏场景支持异构脱敏,如Oracle与MYSQL
16、Oracle与PostgreSQLHive与MYSQL之间的异构脱敏等支持通过时间戳方式对关系型数据库、大数据平台、文件等不同数据源进行增量脱敏敏感类型内置常见敏感类型,包括中文姓名、英文姓名、姓名拼音、韩文姓名、电话号码、邮箱、邮编、金额、日期、企业营业执照、组织机构代码证、银行卡号、军官证、港澳通行证、往来台湾通行证、护照、香港身份证、澳门身份证、税务登记证、身份证、组织机构名称、地址、IP地址、社会统一信用代码、开户许可证、医疗机构登记号、医师资格证书、医师职业证书、车牌号码等脱敏规则算法支持多种脱敏算法,包括SM4加密、SHAl加密、MD5加密、AES加密、RSA加密、随机映射、固定映
17、射、遮盖、替换、偏移等。支持数据一致性关联,如身份证脱敏后,相关的业务字段“生日”“年龄”可与脱敏后的身份证结果保持一致支持对单表指定条件的行/列数据进行脱敏;脱敏效果支持在脱敏前对真实数据进行预脱敏,确认脱敏效果相关要求:1、本项目需实现国产信创部署,如涉及有操作系统、数据库、中间件等均包涵在本项目内。2、分类分级数据库对象包含现有及项目质保期内医院所有数据库。3、本项目为交钥匙工程,供应商将提供完整的信息系统解决方案及配套的系统设备,包含但不仅限于软件系统、国产化数据库、国产化操作系统、国产化中间件,并确保各组件配套协同、稳定运行。4、签订合同前提供本项目相关系统原厂三年质保函(复印件无效
18、服务承诺书要求有明确服务年限)。由原厂工程师到本地完成采购设备安装工作,不得影响原有业务系统。二、项目实施进度要求(1)安装地点:XX市XX医院XX总院。(2)项目实施完成时间:自合同签订后,6个月内完成,供应商应在投标文件中标明工期及实施计划、进度。三、项目培训要求系统操作培训:主要面向使用人员,供应商需提供操作培训及文档。四、项目售后服务要求(1)供应商必须根据本次采购文件所制定的目标和范围,提出相应的售后服务方案。(2)提供7*24小时日常服务,通过提供电话、VPN远程连接等技术支持方式,以解决日常系统出现的问题咨询和故障处理。当采购人出现紧急故障情况时,立即向供应商电话报修,要求供应
19、商10分钟内响应,积极配合诊断并进行处理。(3)要求针对本项目成立软件开发实施项目组,明确项目经理及其他具体人员组成和分工。项目经理负责定期每月向甲方提交工作计划月报以及每周提交工作周报总结,监管项目按进度和计划有效开展。(4)在本合同项目实施及维保期间内,供应商应承诺对合同范围内的产品免费提供更新、升级服务。(5)免费质保期:自项目验收之日起,至少为期原厂3年质保。五、项目验收要求项目的工作内容及成果文档的提交应覆盖以下内容,电子文档是成果不可分割的部分。(1)实施确认书;(2)培训资料;(3)安装维护手册;(4)使用操作手册;(5)项目验收报告。六、付款方式按XX省财政厅关于进一步发挥政府采购政策功能全力推动经济稳进提质的通知(X财采监2022)3号)等文件要求执行,具体付款方式由双方协商后在合同中明确。不得把履约保证金转为质量保证金或收取质量保证金。