只有正确选择参数,才可以使SVM的分类得到比较好的效果。SVM佳参数选择目前还没有十分好的方法,一般可通过交叉试验进行求解,但这种方法相当费时;在实践中也可以采用网格搜索法来确定参数,但该方法需要人为确定参数的范围、变化步长等因素,并且识别效果也不一定理想。为了克服上述缺陷,避免参数选择的盲目性,本文使用遗传算法来实现SVM中的参数优化。
遗传算法GA是一种基于自然选择和自然遗传的全局优化算法。用GA对多个体组成的群体进行操作,通过GA可以使个体间的信息得以交换,这样,群体中的个体一代一代地得以优化,并逐步逼近优解。
GA的3个主要算子分别为:(1)选择。即根据每个个体的适应度值大小选择,适应度较高的个体被遗传到下一代群体中的概率较大;适应度较低的个体被遗传到下一代群体中的概率较小。这样就可以使群体中个体的适应度值不断接近优解。
(2)交叉。又称重组,是按较大的概率从群体中选择两个个体,交换两个个体的某个或某些位。交叉算子产生子代,子代继承了父代的基本特征。(3)变异。即以较小的概率对个体编码串上的某个或某些位值进行改变。
遗传SVM遗传SVM流程本文提出的遗传SVM模型,采用GA来优化SVM中的参数,具体过程如下:(1)系统初始化,包括参数和初始种群;(2)计算初始的目标函数值;(3)判断是否达到结束条件,若达到,则输出结果,否则转步骤(4);(4)进行适应度值的计算、选择、交叉和变异;(5)计算子代的目标函数值,并重插子代到种群,转入步骤(3)。
参数选择本文采用真值编码方法,这主要是因为真值编码适合于在较大空间遗传搜索,并且改善了GA的计算复杂性,提高了运算效率。因为要优化两个参数C和σ,所以建立了一个具有40个个体,每个个体有2个变量的随机种群作为原始种群。为了避免SVM的过学习现象,将训练样本划分为正式训练和辅助训练样本,目标函数为正式训练样本集与辅助训练样本集的正判率之和。
在遗传搜索的初始阶段,正式和辅助训练样本集的正判率会同时增加;随着搜索的进行,正式训练样本集正判率的增加会变慢;当正式训练样本集的正判率进一步提高,辅助训练样本集的正判率减小时,就要停止遗传搜索<7>.
结语SVM是一种基于统计学习的理论,有较好的泛化能力,在故障诊断领域得到了越来越多的应用。本文使用遗传SVM进行变压器的故障诊断研究,用GA实现了SVM中参数的优化,该优化方法能快速准确地在大范围内找到优化值,并进一步应用到基于油中溶解气体的变压器故障诊断中。实例分析表明了本文算法的有效性以及相比其他方法的优越性。
进入资讯首页查看更多内容 >