时间序列相似性度量.docx

上传人:scccc 文档编号:12982134 上传时间:2021-12-09 格式:DOCX 页数:3 大小:55KB
返回 下载 相关 举报
时间序列相似性度量.docx_第1页
第1页 / 共3页
时间序列相似性度量.docx_第2页
第2页 / 共3页
时间序列相似性度量.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《时间序列相似性度量.docx》由会员分享,可在线阅读,更多相关《时间序列相似性度量.docx(3页珍藏版)》请在三一文库上搜索。

1、讨论一般时间序列相似的度虽方式1、概念:时间序歹0的相似性度量是衡量两个时间序歹0的相似程度的方法。它是时间序 列分类、聚类、异常发现等诸多数据挖掘问题的基础;也是时间序列挖掘的核心 问题之一。2、意义:时间序列式进行序列查询、分类、预测的基本工作,寻求一种好的度量对提 高挖掘任务的效率和准确性有着至关重要的意义。3、影响因素:两个序列是否相似,主要看它们的变化趋势是否一致。由丁时间序列数据的 复杂性特点,实际中不可能存在两条完全相同的时间序列,即使相似的时间序列往往也会呈现出各种各样的变化。所以,任何两个序列之间都存在着某种差异, 影响这种差异的主要因素有:(1) 噪声:现实的大多数时间序列

2、数据都存在噪声,体现在图形上式指数据的 曲线不光滑,即存在“毛刺”。(2) 振幅平移:即两条形态相似的时间序列分别绕高低不同的均值波动。(3) 振幅伸缩:即两条时间序列的变化趋势相同,但其中一条时间序列在纵轴 上似乎被拉伸或者压缩过一样,即两个序歹0的振幅不同。(4) 时间轴伸缩:是指两条时间序列的波形相似,但其中一条时间序列在时间 轴上按比例伸缩。(5) 线性漂移:是指两条时间序歹0的波动节奏相似,但其中一条时间序歹0呈现 线性递增或递减趋势。(6) 不连续性:是指两条时间序歹0整体的波动趋势相同,只是在别的时间点或 段出现问断。然而,在实际应用中情况要复杂得多,往往是以上多种因素交织在一起

3、。 时间序 列的相似性并没有一个客观的定义, 具有一定的个人偏好性,也就是说,不同的 人或不同的应用场合对各种差异影响的重视程度是不一样的。给定两条时间序列X =Xi,X2,., Xn和Y=y,y2,.ymh相似性度量的问题就是在各种各样差异因素的影响下,寻求一个合适的相似性度量函数Sim(X,Y),使得该函数能很好地反映时间序列数据的特点。4、方法:目前时间序列相似性度量,最常用的有Minkowski距离和动态时间 弯曲。一、Minkowski 距离给定两条时间序列X = x1x2.Xn和Y=y y .yJ它们之间的Minkowski距离如下:rp/pd(X,Y )=21但Xi yiJMin

4、kowski距离是一种距离度量,因为它满足距离的三个条件:(1) 非负性:d(X,Y尹0,当且仅当X =Y,d(X,Y )=0 ;(2) 对称性:d(X,Y )=d(Y,X );(3) 三角不等式:d(Y,Z )<d(X,Y )十d(X,Z )大多简单的相似性度量是 Minkowski距离及其它的变种,Minkowski距离的 优点是简单、直观且计算复杂度不高,与时间序列的长度成线性关系即序列长度 的增加不会造成计算复杂程度的迅速提高。所以当训练集比较大时,Minkowski距离比其他更有效。但是 Minkowski距离不支持时间序列的线性漂移和时间弯 曲,且无法处理不等长的时间序列。参考文献1王达;荣刚;时间序列的模式距离;浙江大学学报(工学版)2004;39( 7);795-79912】方开泰;潘恩培;聚类分析;北京地质出版社;1992; 44-5113范明;孟晓峰.;数据挖掘概念与技术;北京机械工业出版社;20014林南;李志蜀周勇;时间序列模式的相似性研究;计算机科学;2011

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1