论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc

上传人:椰子壳 文档编号:3969484 上传时间:2019-10-11 格式:DOC 页数:8 大小:169.52KB
返回 下载 相关 举报
论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc_第1页
第1页 / 共8页
论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc_第2页
第2页 / 共8页
论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc_第3页
第3页 / 共8页
论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc_第4页
第4页 / 共8页
论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc》由会员分享,可在线阅读,更多相关《论文(设计)-基于数据挖掘技术的电气设备在线监测系统开发09565.doc(8页珍藏版)》请在三一文库上搜索。

1、专业好文档基于数据挖掘技术的电气设备在线监测系统开发包晓晖(福建水利电力职业技术学院,福建永安,366000)摘 要:文章介绍了数据仓库与数据挖掘技术,论述了数据挖掘技术在电气设备在线监测中的应用,并提出了基于此技术的在线监测系统硬件设计,重点分析了数据预处理模块中线性均值法和数据挖掘模块中决策树分类算法的应用。关键词:数据仓库 数据挖掘 在线监测 预处理 算法0引言随着电力系统中电气设备状态在线监测装置的广泛使用,其在线监测到的数据也日益丰富,如何从海量的数据中快速准确地提取用于科学决策的信息,已是一项有助于完善该系统的重点工作。为此所使用的工具算法必须突破传统的简单的数据库表模式应用,建立

2、更为贴近决策者思维过程的支持,代替决策者的复杂数据与信息的处理,及时提供正确决策所需全部信息。1 概述1.1数据仓库与数据挖掘技术数据仓库领域的权威W.H.Inmon给出了数据仓库的一个简短而全面的定义:数据仓库(Data Warehouse)是一个面向主题、集成、时变、非易失的数据集合,是支持管理部门的决策过程。数据仓库是一个环境,而不是一件产品,提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量的、不完全的、有

3、噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。数据挖掘的分析方法主要有分类、估值、预测、相关性分组或关联规则、聚类、描述和可视化等六种。其中,分类、估值、预测属于直接数据挖掘,后三种属于间接数据挖掘。数据挖掘的一般流程为:定义问题清晰地确定某个应用领域或某个问题,确定数据挖掘的目的;数据选择在大型数据库和数据仓库目标中提取数据挖掘的目标数据集;数据预处理进行数据再加工,包括检查数据的完整

4、性及数据的一致性、去噪声,填补丢失的域,删除无效数据等;数据挖掘根据数据功能的类型和和数据的特点选择相应的算法(如汇总、分类、回归、聚类等),在净化和转换过的数据集上进行数据挖掘;结果分析对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识;知识的运用将分析所得到的知识集成到信息系统的组织结构中去。1.2 电气设备在线监测系统电气设备在线监测,就是利用传感、电子、计算机等技术,通过对运行中高压设备的信号采集和传输、数据处理、逻辑判断,来实现对电力设备运行状态的带电测试或不间断的实时监测和诊断。目前,发电厂或变电站的电气设备在线监测系统一般为分层分布式在线监测系统,包括就地监测终端、

5、站方在线监测站、局方主站系统等三层。其监测的主要内容有:发电机绝缘局部放电;变压器、电抗器的局部放电量;容性设备的介质损耗因数、电容量;GIS局部放电情况;电缆绝缘介质损耗、泄漏电流;开关电器绝缘拉杆泄漏电流;系统母线频率、电压、谐波;大气环境参数(如现场温度、湿度)等。2系统总体设计2.1系统目标本文拟开发的基于数据挖掘技术的电气设备在线监测系统,旨在将原在线监测系统的数据与各相关因素的数据组合起来进行探索性、系统性分析;然后,选择并运用数据挖掘算法对这些数据进行剖析,得到各相关因素对设备状态影响的定量表示,以便地获得各类信息,如同一电压等级下同相设备绝缘状况比较,同一生产厂家制造的设施绝缘

6、状况比较,在何时间、何环境条件绝缘参数变化更显著,何种干扰信号容易引起误报警等;根据这种定量表示,结合下一时段系统负荷、气象预测数据,预测出下一时段的电气设备状态曲线,从而准确地判断设备的健康状况,防范未然。2.2系统结构系统采用Server/Client架构,服务器端(局工作部)的工作平台是Windows2000Server,数据库采用MS SQL Server2000。整个系统包括4个模块,完成4个功能:选择数据、数据预处理、挖掘算法、分析预测。客户端(厂站监测站)工作在Win98/ME/XP界面,可以方便地进行分析、预测和浏览预测结果。图1系统的总体结构图客户终端1客户终端n历史数据实测

7、数据数据仓库数据处理服务器端数据挖掘分析预测数据选择3 数据预处理如前述,数据处理模块需将在线监测所得数据进行预处理,这包括检查数据的完整性及数据的一致性、去噪声,填补丢失的域,删除无效数据等。比如对缺失数据,如果缺失数据的前后时间间隔不大,可根据一元探索性数据分析理论的线性均值法来插值弥补。算术均值公式如式(1)示:式(1)应用:若已知n时刻、n+i 时刻的温度值Tn、Tn+i ,而缺少中间的数据,则中间时刻n+j的取值为:式(2)4 数据挖掘4.1算法结合在线监测指标环境温度、湿度、谐波等实际情况,本系统采用的是基于信息论的决策树分类算法。该方法属于从特例推导到一般规则的归纳学习方法。其基

8、本原理是用决策树表示分类的规则。决策树由信息增益(用信息的不确定性的减少作为度量)最大的字段(属性)作为根节点,各个取值为分枝,各个分枝所划分的数据元组为子集,采用递归方法重复建树过程,扩展决策树,最后得到相同类别的子集,再以该类别作为叶节点,从而得到一棵完整的决策树。该算法既可以用此模型分析已有的数据,也可以用它来预测未来的数据。设S为具有s个数据样本的集合。假定类标号属性具有m个不同的值,定义m个不同类Gi (i=1,2, m),设si为类ci中的样本数,则对一给定的样本分类所需的期望信息可由式(3)计算,其反映了信息输出前的平均不确定性。式(3)式中Pi为任意样本属于ci的概率,并用si

9、/s估计。设属性A具有v个不同值a1,a2,av,可以用属性A的取值将S划分为v个子集,即s1,s2,sv,其中sj包含S中在属性A具有值aj的一些样本。如果A选作测试属性,则这些子集对应于由包含集合S的节点生长出来的分枝。设sij为子集sj中类ci的样本数,则根据由A划分成子集的期望信息可由式(4)算出。式(4)式中为第j个子集的权,即等于子集(即A值为aj)中的样本总数除以集合S中的样本数。E(A)值越小,子集划分的纯度越高,其反映了信息输出后的平均不确定性。对于给定的子集Sj,其期望信息为式(5)示值。式(5)式中,Pij为sj中的样本属于类cj的概率,。在A上的分枝所得的编码信息(互信

10、息,又称为信息增益)为式(6)4.2 决策树算法的软件实现在应用软件上,本系统采用了较为简单实用的MS SQL Server2000中的决策树算法。其引入了挖掘模型的概念,挖掘模型的使用摒弃了传统的即挖即用的模式,基于任务建立的挖掘模型可以永久使用。主要步骤分为:新建一个“在线监测挖掘性分析系统”项目设置数据源仓库及其连接创建数据源视图创建挖掘结构并设置相关参数。该算法有两个关键性参数:分枝复杂度(COMPLEXITY-PENALTY):范围在0和1之间的浮点数,用来抑制决策树的增长。决策树的分枝越深,实现拆分的可能性越小,该参数影响该可能性。取值低则增加拆分的可能性,而取值高则降低拆分的可能

11、性。对于电气设备在线监测的取值为0.001较为适合。叶事例限值(MINIMUM-LEAF-CASES):范围为0到2,147,483,647之间的非负整数,用来确定在决策树中生成拆分所需的叶事例的最少数量。取小值将在决策树中引起较多拆分,但可增加过度臃肿的可能性;取大值减少决策树中拆分的数量,但可抑制决策树的增长。对于电气设备在线监测,一般可取值为1。4.3相关属性的确定算法确定后,就要确定条件属性和目标属性了,这主要由专家来确定。在本系统中,相关属性有设备ID、设备类型、检测时间、电容、介损、大气温度、大气湿度等等,可以根据不同的挖掘目标来确定每次挖掘的相关属性。4.4数据的离散化由于决策树

12、算法要求目标属性为离散值,而设备运行中负荷变化率等指标则是连续值,因此需要对它进行离散化。离散化是指将连续值映射到相应的区间中。其中,区间的划分可以是均匀的,也可以是不均匀的。为简化算法,可采用均匀区间,每个区间的大小为5%。离散化后,每个负荷变化率等连续指标就可以用一个唯一表示该区间的符号标识来代替。5系统主要特点5.1推广性。采用Client Server架构,大量的数据处理和计算在服务器端完成,使得对客户端的硬件配置要求很低,且多个用户可同时进行预测,便于系统的推广。5.2实用性。系统采用了高效、稳定的数据挖掘算法,能够在所现有的数据库上进行数据挖掘,具有一定的实用价值和广阔的应用前景。

13、5.3易用性。提供一个图形化的使用界面,以直观、友好的界面将预测结果提交给用户。5.4灵活性。用户可以对挖掘算法的各项参数进行灵活设定,以满足用户多方面的要求。6结束语本文结合电站变电所的设备监测现状,讨论了如何运用数据挖掘的决策树分类算法对设备状态进行分类,寻找出设备状态的分类规则,从而为设备在线监测提供参考信息。该算法在建立设备状态数据仓库的基础上,从现有关系数据库系统中提取数据,组成设备状态分类样本集,可利用SQL语言予以实现,且具有良好的可操作性和实用性。参考文献1 陈文伟,黄金才,赵新昱.数据挖掘技术M.北京:北京工业大学出版社.2002:1232.2曹辉,蔡颖,朱善君.数据仓库技术

14、在电力系统中的应用J.华北电力技术,2004,(3):3538.3伍 力,吴捷,周乐荣.面向规划的广东电网数据库的建立及其应用J.电力系统自动化,1999,23(13):6770.4美.Claude Seidman著.刘艺等译.SQL Server 2000数据挖掘技术指南M.北京:机械工业出版社. 2002.作者简况包晓晖,男,1974年10月出生,工程师,讲师,长期从事电力系统教学、工程设计工作,Email:Based on Data Mining Technology Electrical Equipment Online Monitor System DevelopmentBAO Xi

15、ao-hui(Fujian College of Water Conservancy and Electric Power,Yongan 366000,China)Abstract: The article introduced the data warehouse and the data mining technology, elaborated the data mining technology in the electrical equipment online monitor application, and proposed based on this technology on

16、line monitor system hardware design, analyzed in with emphasis the data pretreatment module the linear averaging method and in the data mining module the decision tree classification algorithm application.Key words: Data Warehouse;Data Mining;Online Monitor;Pretreatment;AlgorithmEditors note: Judson

17、 Jones is a meteorologist, journalist and photographer. He has freelanced with CNN for four years, covering severe weather from tornadoes to typhoons. Follow him on Twitter: jnjonesjr (CNN) - I will always wonder what it was like to huddle around a shortwave radio and through the crackling static fr

18、om space hear the faint beeps of the worlds first satellite - Sputnik. I also missed watching Neil Armstrong step foot on the moon and the first space shuttle take off for the stars. Those events were way before my time.As a kid, I was fascinated with what goes on in the sky, and when NASA pulled th

19、e plug on the shuttle program I was heartbroken. Yet the privatized space race has renewed my childhood dreams to reach for the stars.As a meteorologist, Ive still seen many important weather and space events, but right now, if you were sitting next to me, youd hear my foot tapping rapidly under my

20、desk. Im anxious for the next one: a space capsule hanging from a crane in the New Mexico desert.Its like the set for a George Lucas movie floating to the edge of space.You and I will have the chance to watch a man take a leap into an unimaginable free fall from the edge of space - live.The (lack of

21、) air up there Watch man jump from 96,000 feet Tuesday, I sat at work glued to the live stream of the Red Bull Stratos Mission. I watched the balloons positioned at different altitudes in the sky to test the winds, knowing that if they would just line up in a vertical straight line we would be go fo

22、r launch.I feel this mission was created for me because I am also a journalist and a photographer, but above all I live for taking a leap of faith - the feeling of pushing the envelope into uncharted territory.The guy who is going to do this, Felix Baumgartner, must have that same feeling, at a leve

23、l I will never reach. However, it did not stop me from feeling his pain when a gust of swirling wind kicked up and twisted the partially filled balloon that would take him to the upper end of our atmosphere. As soon as the 40-acre balloon, with skin no thicker than a dry cleaning bag, scraped the gr

24、ound I knew it was over.How claustrophobia almost grounded supersonic skydiverWith each twist, you could see the wrinkles of disappointment on the face of the current record holder and capcom (capsule communications), Col. Joe Kittinger. He hung his head low in mission control as he told Baumgartner

25、 the disappointing news: Mission aborted.The supersonic descent could happen as early as Sunday.The weather plays an important role in this mission. Starting at the ground, conditions have to be very calm - winds less than 2 mph, with no precipitation or humidity and limited cloud cover. The balloon

26、, with capsule attached, will move through the lower level of the atmosphere (the troposphere) where our day-to-day weather lives. It will climb higher than the tip of Mount Everest (5.5 miles/8.85 kilometers), drifting even higher than the cruising altitude of commercial airliners (5.6 miles/9.17 k

27、ilometers) and into the stratosphere. As he crosses the boundary layer (called the tropopause), he can expect a lot of turbulence.The balloon will slowly drift to the edge of space at 120,000 feet (22.7 miles/36.53 kilometers). Here, Fearless Felix will unclip. He will roll back the door.Then, I wou

28、ld assume, he will slowly step out onto something resembling an Olympic diving platform.Below, the Earth becomes the concrete bottom of a swimming pool that he wants to land on, but not too hard. Still, hell be traveling fast, so despite the distance, it will not be like diving into the deep end of

29、a pool. It will be like he is diving into the shallow end.Skydiver preps for the big jumpWhen he jumps, he is expected to reach the speed of sound - 690 mph (1,110 kph) - in less than 40 seconds. Like hitting the top of the water, he will begin to slow as he approaches the more dense air closer to E

30、arth. But this will not be enough to stop him completely.If he goes too fast or spins out of control, he has a stabilization parachute that can be deployed to slow him down. His team hopes its not needed. Instead, he plans to deploy his 270-square-foot (25-square-meter) main chute at an altitude of

31、around 5,000 feet (1,524 meters).In order to deploy this chute successfully, he will have to slow to 172 mph (277 kph). He will have a reserve parachute that will open automatically if he loses consciousness at mach speeds.Even if everything goes as planned, it wont. Baumgartner still will free fall

32、 at a speed that would cause you and me to pass out, and no parachute is guaranteed to work higher than 25,000 feet (7,620 meters).It might not be the moon, but Kittinger free fell from 102,800 feet in 1960 - at the dawn of an infamous space race that captured the hearts of many. Baumgartner will attempt to break that record, a feat that boggles the mind. This is one of those monumental moments I will always remember, because there is no way Id miss this.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1