资源预览内容
第1页 / 共50页
第2页 / 共50页
第3页 / 共50页
第4页 / 共50页
第5页 / 共50页
第6页 / 共50页
第7页 / 共50页
第8页 / 共50页
第9页 / 共50页
第10页 / 共50页
亲,该文档总共50页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计算机学院毕业论文II本科毕业设计(论文) BP神经网络的异常点检测应用可行性研究学 院 计算机学院 专 业 软件工程 年级班别 2006 级(4)班 学 号 3106007039 学生姓名 蔡东赟 指导教师 王丽娟 2010年 5 月IIIIV摘 要异常点数据是指数据集中与众不同数据。这部分数据的量小,但是对于我们的日常生产生活的影响极大。因此,异常点检测被广泛应用于网络入侵检测,金融保险,天气预报以及新药研制等领域。相对于大量的正常数据挖掘而言,异常点检测被称作小模式数据挖掘。BP 算法是一种常用的数据挖掘算法。但是 BP 算法进行实际数据的异常点数据挖掘过程中存在:实际数据的维数较高,存在冗余特征的干扰,以及在高维特征下,数据量不充分的问题。因此,本文分析 BP 神经网络处理各种数据的情况,并得到以下结果。 (1)BP 神经网络能够较好的分离特征单一的仿真数据;但是(2)特征相似性较大的数据集,难以分离判断;(3)正常数据不充分或者不具有代表性,因此正常数据类学习不充分,从而导致异常无法判断。针对以上问题,本文提出了以下的改进措施:(1)BP 算法前进行特征约简(映射)从中选取有益于异常检测的特征(2)多神经网络融合,不同神经网络识别不同的特征,相互取长补短,融合后得到最终的结果。关键字:异常,BP,异常点检测,神经网络注:本设计(论文)题目来源于教师的国家级(或部级、省级、厅级、市级、校级、企业)科研项目,项目编号为: 。VVIAbstractOutlier data is the data set different data. This part of the small amount of data, but for our daily production and life of great. Therefore, the anomaly detection is widely used in network intrusion detection, finance, insurance, weather, and new drug development and other fields. Relative to the large number of normal data mining, the anomaly detection model is called data mining small. BP algorithm is a commonly used data mining algorithm. But the BP algorithm to real data outliers exist in the data mining process: the higher the dimension of the actual data, there are redundant features of the interference, and high-dimensional feature, the issue of inadequate data. Therefore, this paper analyzes a variety of BP neural network processing of data, and to get the following results. (1) BP neural network can better separation characteristics of a single simulation data; but (2) the characteristics of similar large data sets, separation is difficult to judge; (3) normal data is not sufficient or not representative, so the normal data class learning is not sufficient, leading to abnormal can not judge. To solve the above problem, this paper proposes the following improvements: (1) BP algorithm before feature reduction (map) benefit from anomaly detection features selected (2) integration of multiple neural networks, different neural network to recognize the different characteristics of each each other, the final fusion result.Key Words:Outliers-Data,BP ,Algorithms,Neural NetworksVIIVIII目 录1 引言 .11.1 背景 .11.2传统已有异常点算法介绍 .11.2.1 基于统计学的异常点检测算法 .11.2.2 基于距离的异常点检测算法 .21.2.3 基于密度的算法 .31.2.4 基于偏差的异常点检测 .51.2.5 基于聚类的异常点检测算法 .62 基于属性特征在异常点检测中的研究 .73 BP神经网络介绍 .93.1 模型简介 .93.2 计算各层节点输出 .93.3 修正权值 .104 异常检测中 BP 神经网络的设计 .134.1 可微阈值单元 .134.2 单个 BP 网络结构设计 .134.3BP 神经网络学习过程的基本步骤 .145 实验研究 .175.1 研究使用的数据库介绍 .175.2 训练方案一实验:把 bp 神经网络相似性代替距离算法相似度量 .175.3 训练方案二实验:用单个神经网络对训练数据库整体特性进行学习 .185.4 训练方案三实验:多神经网络各种形式训练及其决策 .
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号