软件工程中的数据挖掘技术应用研究.docx

上传人:scccc 文档编号:14545528 上传时间:2022-02-08 格式:DOCX 页数:2 大小:65.87KB
返回 下载 相关 举报
软件工程中的数据挖掘技术应用研究.docx_第1页
第1页 / 共2页
软件工程中的数据挖掘技术应用研究.docx_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《软件工程中的数据挖掘技术应用研究.docx》由会员分享,可在线阅读,更多相关《软件工程中的数据挖掘技术应用研究.docx(2页珍藏版)》请在三一文库上搜索。

1、软件工程中的数据挖掘技术应用研究摘要:大数据的应用为各行各业的数据分析工作带来了巨大的便利。大型软件工程无论 是在技术还是管理方面都涉及到大量的数据,但如何有效管理并充分利用这些数据是当前的 难点之一。本文着重从软件漏洞扫描、执行记录分析、开源软件挖掘、版本信息管理等方而 介绍了据挖掘技术在软件工程中的应用,可以为软件行业提供参考。关键词:数据挖掘;软件工程:大数据技术数据挖掘是大数据分析领域中的一个新的数据处理理念,它的核心思想是通过对数量巨 大、但价值密度低的数据进行分析处理,从而提取出一些对所研究的问题有价值的信息。随 着软件工程的发展,在软件开发和项目管理过程中也逐渐出现了海量数据分析

2、的难题,例如 源代码管理、版本管理、漏洞分析、系统操作记录。软件长期运行所积累下来的数据,由于 数据量过大,传统的数据处理技术显然是不可能完成的。为此,研究数据挖掘技术在软件工 程中的应用具有重要意义。一、软件工程数据挖掘技术的发展数据挖掘技术最早诞生于20世纪80年代,当时是为了挖掘数据库中的知识价值而提出 的,并且主要集中在理论研究。随着大数据问题的日益突出,数据挖掘技术开始受到人们的 广泛关注,研究的焦点也开始由理论转向实践,在各领域中得到了广泛的应用。而软件工程 的概念则是大约产生于20世纪60年代末,当时则是为了解决软件危机”而提出的。可见, 数据挖掘技术与软件工程在发展上大致保持同

3、步,这为数据挖掘技术在软件工程中的应用奠 定了良好的基础。进入21世纪以来,软件工程的发展更加迅速,在短短十几年内就实现了许 多国家和地区的信息化改造,使软件工程进入一个全新的发展阶段。软件工程的大发展使得 系统中的数据越来越多,处理难度日益增加,而此时的大数据技术已有一定的理论基础,采 用数据挖掘技术解决软件工程中遇到的难题,成为一种必然的选择。二、数据挖掘在软件工程中的应用软件漏洞扫描漏洞检测是软件工程的重要内容,是发现安全隐患、提高软件质量、 保障系统安全的有效措施。在传统的漏洞检测技术中,由于需要扫描的数据量过大,如果逐 条依次分析,将导致长时间的等待,可操作性不强。在漏洞扫描中引入数

4、据挖掘技术,可以 有效提高扫描效率。典型的基于数据挖掘的软件漏洞扫描应用步骤如下:第一,创建测试项 目。根据用户的具体需求制定软件测试方案,明确需要扫描哪些类型的漏洞,采用什么方案 进行扫描。第二,收集漏洞信息。扫描漏洞的前提是要认识漏洞,也就是对漏洞进行定义。 需要收集有关软件缺陷的大量信息,并对一些属性进行定量化处理。第三,选择理论模型。 根据扫描要求,选取适当的数据挖掘模型,根据前期收集的数据资料,对模型进行充分的训 练,得到有效的训练集与测试集,取得最佳扫描策略。第四,开展漏洞扫描。采用前一步得 到的模型,将其应用于软件扫描测试过程,经过数据的分类和特征分析,提取漏洞信息.第 五,根据

5、扫描结果,修复漏洞,并重新扫描以确认漏洞的成功修复。(-)执行记录分析分析程序的执行路径对于代码关联性分析具有重要意义,对软件的 执行记录进行数据挖掘,有助于深入理解代码功能以及软件的维护。执行记录的数据挖掘在本质上看就是对其执行路径进行跟踪,然后逆向建立模型。其数据挖掘的过程一般包含插装、 跟踪、记录、分析等步骤。首先在待测试的软件代码中插装相应的信息,并执行软件,将其 执行过程记录下来,经预处理后,采用分类、类聚、关联等大数据分析手段提取出关键记录 信息,从而绘出系统功能模型或架构。(三)开源软件挖掘复制代码是开源软件数据挖掘分析技术中最常见的应用领域,在软 件工程中,代码复用是十分常见的

6、,根据笔者经验,至少有一半的通用源代码都会在多个项 目中反复使用。这意味着采用代码克隆检测技术可以有效完成对软件内部代码之间,以及不 同软件之间的代码进行检测,快速提取出具有利用价值的代码段。通过对代码特征的分析, 可以避免代码克隆过程中引入漏洞,还可以更好地为软件的后期维护或升级提升参考。(四)版本信息管理代码管理是软件工程中涉及的重要问题,几乎所有软件企业都会采 用版本控制系统对软件或代码版本进行维护,以确保团队成员之间可以获取全局一致的代码。 但在大型软件开发团队中,代码管理是一件十分复杂的事,任何一次更新都会引入代码管理 混乱的风险。数据挖掘技术可以对软件的变更历史信息进行挖掘,通过大

7、量代码的对比分析 确立各模块和版本之间内部联系,在保证代码高效融合的过程中,也有效地避免了漏洞的引 入。三、小结随着软件产业的不断壮大,软件工程只有不断引入新的管理和技术工具才能适应快速发 展的需求,作为一种可实现快速精确测量的数据分析技术,数据挖掘成为了软件工程不断向 前发展的重要支撑。与此同时,数据挖掘技术也在不断地发展进步,各种新的数据挖掘理论 不断涌现,使大数据的处理变得日益方便快捷。不难发现,在未来的软件工程中,各类大数 据分析技术将与软件开发和管理过程更加紧密地融合在一起,为软件项目的评估、开发过程 管理、系统测试及维护等工作提供重要的决策依据。参考文献1唐海燕,兰兵.数据挖掘技术在软件工程中的应用J.电子技术与软件工 程,2019(23):141-142.2乔磊.软件工程数据挖掘的发展趋势J.电子技术与软件工程,2019(7):172.3赵亮,梁胜彬,冯天伟.面向数据的软件工程方法研究J.信息系统工程,2018(10):28.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1