基于PCA和PSO-SVM算法的鸡精调味料风味质量模型研究
2021-08-26 15:17:42 来源: 食品安全导刊
程 龙,靳 涛,刘凤莲(滨州市厨具产品质量检验中心,山东滨州 256600)
摘 要:目的:提出一种基于主成分分析和粒子群优化——支持向量机算法的鸡精调味料风味质量模型。方法:以6种鸡精调味料风味感官数据为研究对象,对鸡精调味料的风味成分进行主成分分析,降低数据维数;利用粒子群优化算法获取支持向量机的最佳参数,并用支持向量机完成对鸡精调味料风味数据的训练和分类。结果:本文提出的模型与其他传统模型相比,具有较高的准确度,且实用价值高。
关键词:鸡精调味料;PCA;PSO-SVM算法;支持向量机;质量控制模型
随着人们生活水平的不断提高,人们对美食的要求也越来越高。鸡精调味料作为一种重要的食品调味料,其风味质量很大程度上决定了食品的口感[1]。传统方法一般采用仪器分析和人工评吸的方式进行风味质量控制。但仪器分析获得的数据只能用来建立鸡精调味料成分的风味数据库,人工评吸的方式受品评人员的经验限制,且主观性强,费用高,不利于大批量数据的感官评测。
主成分分析(Principal Component Analysis,PCA)是多元统计中的一种数据挖掘技术。其主要用来将数据降维,在不丢失主要成分信息的前提下,选择较少的变量来替代原有的变量,以达到数据冗余的目的,加快运算速度。支持向量机(Support Vector Machine,SVM)是一种基于小样本的模式识别算法,它不仅能够克服传统神经网络对样本大容量的要求,还能够有效解决维数灾难及局部最小值问题,并且在解决非线性问题上表现出色[2]。
鸡精调味料组成成分复杂多样,且存在非线性关系和大量的数据冗余[3]。针对以上问题,本文提出了一种基于主成分分析(PCA)和粒子群优化—支持向量机(PSO-SVM)的鸡精调味料风味质量模型。其中,PCA算法有效解决组成成分之间的数据冗余,降低数据维数。PSO-SVM算法则解决传统神经网络复杂,对数据质量要求高的问题,且通过PSO算法的参数优化[4],SVM算法的分类识别效果更好。该模型能在有限的数据样本训练下,有效地对不同的鸡精调味料进行分类,从而建立一个效果较好的鸡精调味料风味质量模型。
1 基于PCA和PSO-SVM算法的风味质量模型
算法设计步骤如下:
①将鸡精调味料样本数据先进行归一化数据预处理。这样便于识别成分信息,避免出现“大数吃小数”的现象;②将经过归一化处理的数据进行主成分分析,降低数据的维数,获取一组线性无关的主成分来代表样本的模式特征,样本贡献率要大于85%;③利用粒子群优化算法得到SVM的最优参数和,使得SVM的分类效果最佳;④将经过主成分分析后的数据导入SVM中进行训练,并选取样本进行预测分析。
2 实验结果与分析
2.1 数据来源和试验平台
本文数据来源于一组鸡精调味料数据。样本共有6种,样本标签名称分别为K524、G101、G822、K365、K362和K862。每种鸡精调味料有16个样本,共96个样本。将每种鸡精调味料的前10个样本用作SVM的训练集,剩余样本作为测试集。即训练集有60个样本,测试集有36个样本。
采用matlab2012a结合python2.7混合编程,并利用libsvm工具包模拟。
2.2 PCA分析
将鸡精调味料数据作[0,1]归一化后,利用Matlab对数据进行PCA分析,得到各主成分之间的特征贡献率和累积贡献率。
前两个主成分的累计贡献率约为92.66%,能够包含原始数据的绝大部分的风味信息,所以选取第一和第二主成分作为新的变量来观测分析。
2.3 PSO-SVM模型预测分类
由主成分分析可知,选取前两个主要因素作为SVM的输入,将60个样本作为训练集,36个样本作为测试集。采用交叉验证方式的准确率作为PSO的适应度函数值,寻找SVM的最佳参数值bestc和bestg。
SVM的核函数选择上,选取径向基核函数作为本文SVM的核函数。利用4种核函数做SVM分类(SVC)的最优超平面(决策边界)[5],如图1所示。
为了进一步检验PCA和PSO-SVM模型性能的好坏,本文分别采用普通支持向量机分类器、基于PCA改进的支持向量机分类器以及BP神经网络分类器(BPNN)进行对比分析,识别精度作为评价检测模式性能优劣的标准,识别精度越高对应模型性能越好。4种不同模型的识别效果如表1所示。由表1可知,PCA和PSO-SVM分类器模型识别精度达到了98.87%,远高于PCA-SVM分类器、支持向量机分类器(SVM)和BP神经网络分类器(BPNN)。说明本文提出的基于PCA和PSO-SVM算法的鸡精调味料风味质量模型分类预测效果良好。
3 结语
本文提出的基于PCA和PSO-SVM算法的鸡精调味料风味质量模型优势体现在类别的选取上突破了很多文献只有2到3类的局限,选取了6种鸡精调味料作为样本。首先样本数据进行归一化预处理,接着用PCA对数据进行降维。然后使用PSO优化SVM的参数,选取RBF核函数作为SVM的核函数,得到一个分类率最高的SVM模型。并将模型的分类识别率与其他方法(如BP神经网络、传统SVM等)进行对比,结果表明本文方法具有更好的分类预测效果。该模型很好地克服了传统鸡精调味料风味分析方法中实时性差、可重复性差的缺点,为鸡精调味料的风味质量控制提供了一种快速有效的方法。
参考文献
[1]秦蓝,李凤华,田怀香,等.电子舌在鸡精调味料味觉差异分析中的应用[J].中国调味品,2014,39(10):132-135.
[2]余道洋,戚功美,瞿顶军,等.基于SVM和PCA的痕量多组分气体检测方法[J].模式识别与人工智能,2015,28(8):720-727.
[3]秦蓝,李凤华,田怀香,等.鸡精调味料人工感官评价与电子鼻感官分析的相关性研究[J].食品与机械,2014,30(4):11-13.
[4]胡旺,李志蜀.一种更简化而高效的粒子群优化算法[J].软件学报,2007(4):861-868.
[5]吴桂芳,何勇.基于主成分分析和支持向量机的山羊绒原料品种鉴别分析[J].光谱学与光谱分析,2009,29(6):1541-1544.