资源预览内容
第1页 / 共24页
第2页 / 共24页
第3页 / 共24页
第4页 / 共24页
第5页 / 共24页
第6页 / 共24页
第7页 / 共24页
第8页 / 共24页
第9页 / 共24页
第10页 / 共24页
亲,该文档总共24页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1 葡萄酒相关问题的模型与优化 摘 要 本文主要研究酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响问题,根据题目所 给定的一些数据,分析并建立了他检验、主成分分析、模糊综合评判、典型性相关分析、 多元线性回归和灵敏度分析相应的模型. 问题一:针对附件 1 中的对葡萄酒的品评数据具有信息量大、影响因素多等特点,通过对数据进行简化,然后对每组所得的数据进行T检验,进行显著性检验,利用Spss软件求解,得出红、白两组评价均为显著,且红、白葡萄的第二组评酒员的评价都更可 信. 问题二:用主成分分析提取酿酒葡萄理化指标的 8 个主要成份,接着运用模糊综 合评价方法对酿酒葡萄理化指标与葡萄酒质量进行分析, 实现酿酒葡萄由 15 个等级的 划分. 问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系,建立典型性相关模型,利用Spss软件求解,得出各相关系数矩阵以及相关系数,得出这些理化指标间的或正或负相关关系. 问题四:使用多元回归分析建立酿酒葡萄和葡萄酒的理化指标以及芳香指标对葡 萄酒质量影响的模型, 得出, 如红葡萄: 葡萄总指标以及葡萄酒总指标都对其呈正相关, 芳香指标都对其呈负相关.后用局部灵敏度分析对模型的参数进行灵敏度等级划分.由其 结果得出各参数的灵敏度均为中等或以上.证明能用能否用葡萄和葡萄酒的理化指标来 评价葡萄酒的质量. 关键词:T检验;主成分分析;模糊综合评判;多元回归;灵敏度分析 2 一、问题重述一、问题重述 1.11.1 问题的背景问题的背景 葡萄酒有着 7000 余年的悠久历史, 并且拥有丰富的文化底蕴, 由于色泽亮丽, 香 气浓郁, 营养丰富, 深受世界各国消费者青睐, 经久不衰.葡萄酒化学成分复杂, 葡萄 酒的质量是各种化学成分的综合反映.为了确定葡萄酒的质量,一般是聘请一批有资质 的评酒员进行品评.通过每个评酒员在对葡萄酒进行品尝后对其分类指标打分,求和得 到其总分,最终确定葡萄酒的质量. 1.21.2 问题的提出问题的提出 1)分析两组评酒员的评价结果,说明评价结果是否有显著性差异,哪一组结果更可信. 2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级. 3)分析酿酒葡萄与葡萄酒的理化指标之间的联系. 4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄 酒的理化指标来评价葡萄酒的质量. 二问题分析二问题分析 2.12.1 问题一的分析问题一的分析 由于两组评酒员的评价数据时两两配对,近似正态分布,可以采用Spss软件的配对样本T检验功能来研究两组评酒员的评价结果是否有显著性差异. 2.22.2 问题二的分析问题二的分析 由于酿酒葡萄的指标太多,所以不同指标的影响也不同,根据题目所给的数据用Spss软件中的主成分分析法确定其中的主成分.又因为葡萄酒的品评一般是通过聘请一批有资质的评酒员进行品评,而品评往往受到品评员的嗜好、习惯、情绪、年龄、经验 等因素影响,评定常有一定的主观性和不确定性,这会使评分的可靠性受到影响.所以 采用模糊综合评判模型来处理上述的模糊因素,从而对酿酒葡萄进行分级. 2.32.3 问题三的分析问题三的分析 酿酒葡萄与葡萄酒的理化指标都含有多个变量, 为了探讨酿酒葡萄与葡萄酒的理化指标之间的关系,采用Spss软件中的典型相关分析,揭示两组变量之间的内在联系. 2.42.4 问题四的分析问题四的分析 酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响的研究中, 因变量的变化往往受几 个重要因素的影响, 此时就需要用两个或两个以上的影响因素作为自变量来解释因变量 的变化, 采用多元线性回归来解决问题.通过灵敏度确定哪些参数对葡萄酒质量有影响. 三三问题假设问题假设 3.1 假设所有评酒员都是公正的. 3.2 假设附表中数据允许有误差出现. 3.3 假设所有的评酒员在不受外界客观因素的影响. 3 四、四、符号说明符号说明 ix第i个因素的原变量 iz第i个主成分 ijl截荷 i第i个特征根 ia第i个权系数 )()(,iiba第i个特征向量 误差 ie影响值 五、五、问题一的求解问题一的求解 5.1 5.1 T检验检验模型的建立模型的建立与求解与求解 由于问题一中的数据近似正态分布,采用T检验来判定两组评酒员的评价结果,观 察两组数据的均值是否差异,从而判断两个均值的差异是否显著. 5.1.1 5.1.1 建立建立T检验模型检验模型 步骤 1:提出原假设. 步骤 2:选择统计量. 对两样本T检验采用T统计量. 对两组样本分别计算出两组的观测值的差值得到差值样本. 利用差值样本,通过对其均值是否显著为 0 的检验来判断两总体均值的差是否显著为 0. 步骤 3:计算检验统计量观测值和概率-P值 . 步骤 4:给定显著水平,并作出决策. 5.1.5.1.2 2模型求解模型求解 方案一方案一: 两配对样本T检验的原假设0H为:两总体均值无显著差异. 表述为: 0-210=:H (式 5-1) 1,2分别为第一个和第二个总样本的均值. 表表 5 5- -1 1 第一组与第二组葡萄酒的成对样本统计量第一组与第二组葡萄酒的成对样本统计量 成对样本统计量 均值 N 标准差 均值的标准误 第一组红葡萄酒 73.056 27 7.3426 1.4131 第二组红葡萄酒 70.515 27 3.9780 .7656 第一组白葡萄酒 74.26 28 5.201 .983 4 成对样本统计量 均值 N 标准差 均值的标准误 第一组红葡萄酒 73.056 27 7.3426 1.4131 第二组红葡萄酒 70.515 27 3.9780 .7656 第一组白葡萄酒 74.26 28 5.201 .983 第二组白葡萄酒 76.532 28 3.1709 .5993 由表 5-1 可看出第一组红葡萄酒的均值为 73.056,第二组红葡萄酒的均值为 70.515;第一组白葡萄酒的均值为 74.26,第二组白葡萄酒的均值为 76.532,可以初步 判定两组评酒员的评价结果有一定的显著性差异.第一组红葡萄酒的标准差比第二组红 葡萄酒大,所以第二组更可信.同理,第一组白葡萄酒的标准差比第二组白葡萄酒大, 所以第二组更可信. 利用Spss软件计算两组样本的差值,并计算出T统计量的观测值和对应的概率-P值,如表 5-2. 表表 5 5- -2 2 第一组与第二组葡萄酒的第一组与第二组葡萄酒的简单相关系数及检验简单相关系数及检验 成对样本相关系数 N 相关系数 Sig. 第一组红葡萄酒 , 2 , 1(pjmilij=. 2)计算相关系数矩阵 (式 6-4) ), 2 , 1,(pjirij=为原变量ix与jx的相关系数,jiijrr =,其计算公式为 = = nknkjkjikinkjkjikiij xxxxxxxx r11221)()()((式 6-5) R是实对称矩阵(即rij=rji) ,只需计算上三角元素或下三角元素即可. 3)计算特征值与特征向量 解特征方程 ,常用雅可比法)(Jacobi求出特征值,并使其按大小顺序排列 ; 分别求出对应于特征值 的特征向量 ,要求 =1,即 其中 表示向量 的第j个分量. 4)计算主成分贡献率及累计贡献率 贡献率: ), 2 , 1(1pipkki= =(式 6-6) 累计贡献率: (式 6-7) 一般取累计贡献率达 85%-95%的特征值, 所对应的第 1、 第 2、 、 第)(pmm=pppppprrrrrrrrrR2122221112110=RI021pi), 2 , 1(piei=ie112= = = =pjijeijeie), 2 , 1(11pipkkikk = =m,218 个主成分. 5)计算主成分载荷 其计算公式为 ), 2 , 1,(),(pjiexzplijijiij=(式 6-8) 得到各主成分的载荷以后,还可以按照(式 6-3)进一步计算,得到各主成分的得分 =nmnnmmzzzzzzzzzZ212222111211(式 6-9) 6.1.26.1.2 酿酒葡萄的理化指标的主成分模型的求解酿酒葡萄的理化指标的主成分模型的求解 1)红葡萄的主成分 红葡萄的指标体系与原始数据见表 6-1. 表表6 6- -1 1 红葡萄的原始数据红葡萄的原始数据 样品编 号 氨基酸总 量 蛋白质 VC 含量 果皮质 量2 果皮颜 色 果皮颜 色2 葡萄样 品1 2027.96 553.106 0.251 24.067 0.780 0.260 葡萄样 品2 2128.82 626.478 0.062 26.070 0.647 1.250 葡萄样 品3 8397.28 585.046 0.315 25.500 1.087 0.617 葡萄样 品25 1409.70 537.084 0.064 27.097 1.520 0.920 葡萄样 品26 851.17 587.293 0.416 27.997 1.093 0.827 葡萄样 品27 1116.61 528.331 0.091 28.790 2.333 1.227 利用Spss软件中进行主成分分析法,得到相关系数矩阵见表6-2. 9 表表6 6- -2 2 红葡萄的相关系数矩阵红葡萄的相关系数矩阵 1x 2x3x 28x29x30x1x 1 0.024 -0.121 -0.338 -0.025 0.11 2x0.024 1 -0.014 -0.219 -0.18 -0.206 3x-0.121 -0.014 1 0.131 0.023 -0.162 28x-0.338 -0.219 0.131 1 0.326 -0.053 29x-0.025 -0.18 0.023 0.326 1 0.865 30x0.11 -0.206 -0.162 -0.053 0.865 1 指标之间有一定的相关性,是做主成分分析的前提.从表6来看,得到氨基酸总量、 蛋白质、VC含量、 花色苷、 酒石酸、 苹果酸、 柠檬酸、 多酚氧化酶活力、 褐变度、DPPH 自由基1、总酚、单宁、葡萄总黄酮、白藜芦醇十四个指标之间的相关性都比较高. 相关系数的特征根和方差贡献率见表 6-3,前八个主成分的累计贡献率达到 86.247%85%,故选择前八个主成分. 表表 6 6- -3 3 红葡萄的相关系数的特征根和方差贡献率红葡萄的相关系数的特征根和方差贡献率 图图 6 6- -1 1 红葡萄主成分红葡萄主成分 由图 6-1 红葡萄的其余七项指标都趋向于氨基酸为 2000 到 3000. 2)白葡萄的主成分 成分 特征根 方差的 % 累积 % 1 6.966 23.221 23.221 2 4.94 16.467 39.687 3 3.737 12.457 52.144 28 -3.06E-17 -1.02E-16 100 29 -1.20E-16 -4.00E-16 100 30 -3.41E-16 -1.14E-15 100 10 利用Spss软件可得到白葡萄酒的相关系数矩阵见表6-4得到氨基酸总量、蛋白质、VC 含量、花色苷、酒石酸、苹果酸、柠
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号