非平衡时序数据的动态时间规整过采样方法研究
作者:admin时间:2019-04-17 03:42:23阅读:257来源:本站
时间序列分类问题广泛存在于动作识别、语音识别、异常检测、医学疾病检测等领域中。在这类分类问题中,常常出现数据非平衡问题,大多数的数据挖掘算法对于数据类别相对平衡的假设前提无法满足,导致最终的学习效果不理想。并且,时序数据具有高维性、允许时间上的位置偏移和尺度缩放、存在时序上动态关联等有别于横截面数据的特点,已有的非平衡横截面数据的处理方法还不能直接应用于非平衡时间序列的处理过程中。本文考虑到时序数据的特点,提出了一种针对非平衡时序数据的过采样方法,在动态时间规整(DTW)定义的度量空间下,进行安全集与噪声集划分、权值修正、近邻选择、路径插值,在安全集中每个少数类样本与其k近邻中的少数类样本之间按修正权重生成新的时序样本。选择UCR时序数据库中的12个非平衡数据集,使用高斯过程分类模型,检验过采样方法效果。实证分析结果表明:(1)本文的方法(SDTW)生成的新样本较ROS、SMOTE、BSMOTE等方法均匀,两类样本的边界清晰,尽量保持原样本的分布,在近邻选择上仅选择同类,克服了SMOTE近邻选择的盲目性,且位于噪声集的少数类周围不生成人工样本,有效防止了引入额外的噪声。(2)对非平衡时序数据进行处理,提高了GPC的分类效果;SDTW在准确率、F值、G均值、AUC等各个评估指标上表现良好,优于ADASYN、SMOTE、BSMOTE等经典的非平衡横截面数据处理方法;Friedman检验显示各个方法的性能存在差异,SDTW在准确率、F值、G均值、AUC上均显著优于其他方法。(3)在不同非平衡率的数据集上,SDTW在各个评估指标上亦领先其他方法。通过实证分析证实了SDTW在处理非平衡时序数据上的有效性,可以应用到现实非平衡时序分类任务。
最新更新
热门推荐
- [博士论文]语义检索模型的设计与优化
- 语义检索模型的设计与优化语义检索概念语义检索是一种在语义网络上查询和检索的技术,也称语义检索为概念匹···[全文]
- [博士论文]深入学习本体论和语义检索
- 引言在教育领域,数字化步伐迅速加快,数字教育资源呈现井喷式增长。如今,越来越多的用户通过互联网进行学···[全文]
- [博士论文]用语言塑造形象的文学
- 用语言塑造形象的文学艺术、音乐、舞蹈、戏剧、电影、建筑、雕塑等,通过塑造具体而感性的艺术形象,帮助读···[全文]
- [博士论文]文学史上的两种创作方法
- 作品成功的标志——典型标志俄罗斯大作家果戈里曾经听过一个故事:一个小官员非常喜欢打鸟,节俭,并利用休···[全文]
- [博士论文]崇尚理性的古典主义人文思潮和文学
- 人文思潮和文学“人类是一件伟大的杰作!多么高贵的理性!多么伟大的力量啊!多么美丽的外表啊!多么优雅的···[全文]
- [博士论文]自然主义是西方的一种文学创作方法
- 古典文学具有情节简单、结构紧凑的优点,但它束缚了自己,因为它把一些原本合理的东西变成了规则和戒律。同···[全文]
- [博士论文]书法艺术在现代创新的要求
- 乐泉是如此的简单和粗俗。说话,做事,不注意大开大合,看起来飞扬,但注意平和的语言,真诚的话语,方便人···[全文]
- [博士论文]纯文学作者的世俗关怀是最深层次的
- 作为一个在中国长大的作家,血液中没有宗教成分。那么,当他想与强大的传统世俗世界作斗争时,是什么支持他···[全文]
- [博士论文]写作就是不断打败他们的传统
- 对人类精神的深入探讨不断揭示了精神王国的面貌,展现了一个与我们肉眼看到的小世界相对称的全新、陌生、难···[全文]
- [博士论文]七子文学复古运动的主要内容
- 受复古特征的影响,复古人非常重视”法“,关注的程度与复古人的文体意识成正比。七子派有很强的文体意识,···[全文]