葡萄酒的评价_求解研究报告由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“葡萄酒质量评价分析”。
葡萄酒的评价模型
求解报告
许腾宇 徐丹丹 蒋亚琪
葡萄酒的评价求解研究报告
A题 葡萄酒的评价
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格)
附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格)
问题重述
本题目标是评价葡萄酒以及对其分级。属于数据分析的评价模型。
关于葡萄酒,题目给予了含有红葡萄酒与白葡萄酒、两组品酒员、葡萄酒与葡萄这三类的对比关系的数据。数据又可分为两类指标,一类是感官评价的指标:品酒员的品尝评分;另一类为理化指标,有关于葡萄酒与酿酒葡萄的各化学物质含量指标。
葡萄酒的品酒员评价是由众位品酒员对一批葡萄酒样品的每份样品进行评价。(评价指标:外观
(澄清度、色调)、香气(纯正度、浓度、质量)、口感(纯正度、浓度、持久性、质量)、平衡/整体评价。)由于评价尺度、价值观、品酒能力等的差异,不同的品酒员往往给出不同的评价。这需要我们对两组评分数据进行差异性与稳定性评价。(如问题一)
而关于问题二,是以葡萄的理化指标以及葡萄酒的质量为元素建立其葡萄酒的评价模型,然后进行分级。然而理化指标包罗万象。各指标间有相关性以及重叠,且模型的变量元素不宜太多。所以简化指标势在必行。至于简化方法,大都与主成分分析、聚类分析等有关,但各有特色。
问题一:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 此题抽去葡萄酒的背景,简单来说是考察两组数据的显著差异性以及可信度。
(一)显著差异性
显著差异性是建立在“小概率事件不会发生”的原理假设上。认为A、B两数据组没有差异(只有5%的随机误差)的概率很小,属于小概率事件,则认为A、B两组数据有一定差异,即差异显著。
四篇论文关于显著差异性的检验主要分为两类:方差分析与配对t检验、以及符号秩检验。这两种方法都依靠软件的操作(如MATLAB、SPSS软件),以下是各自原理。方案一:配对t检验
双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。t检验的适用条件(1)已知一个总体均数;
(2)可得到一个样本均数及该样本标准差;(3)样本来自正态或近似正态总体。
本题是比较两组数据间的显著差异性,趋于适用配对t检验。
方案二:符号秩检验
符号检验是一种非参数检验方法。它是根据正、负号的个数来假设检验。这种检验是将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。
符号秩检验是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。它适用于 T 检验中的成对比较,但并不要求成对数据之差服从正态分布,只要求对称分布即可。由于葡萄酒质量评判的分布的不确定性,本问题的研究适应于用符号秩检验的方法来进行。
(具体操作忽略)
综上两种方法最后都要将结果与表对照,求得P的范围,若P
(二)可信度
方案一:各样品酒的评分和数据组的方差比较
对于两组评酒员的品评结果哪组更可信的问题,可以用组评结果的稳定性来衡定。通过两组评酒员对每种葡萄酒样品评分的波动性大小,来确定结果的可信度。可以用两组品酒员对每种样酒的各项评分加和,再用得到的数据组求得方差,比较哪组数据更稳定。还有就是t检验也可得到稳定性分析,在此不必赘述。方案二:各评价指标的标准差比较
也可以将所有酒样品以评分指标划分数据组。首先求出每个样品中各个项目 10 个评酒员的评分的标准差,然后通过将不同样品同一指标的标准差求和,得到各个组不同评分指标的标准差之和。再做成折线图如下:
可以看出第二组的各项指标的标准层折线大都在第一组下面,显然第二组数据更稳定,即更可靠。【1】
问题二
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
首先,酿酒葡萄的理化指标实在太多,对于将要建立的数学模型或是其他分级手段而言,其参与的因变量不能太多,因此,将变量组降维势在必行。
(一)降维
方案一:将红葡萄的各种理化指标作为变量因子进行主成分分析,对其进行降维因子分析。基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。此处变异即是以方差为贡献影响力的指标
将这些因素以方差从大到小排列,按照主成分分析的理论,如前 n 个主成分的累计贡献率达到了85%,则这 n 个主成分能够反映出足够的信息。由表3 可看出,前 9 个主成分的累计贡献率已经达到了 85. 556%,故选取前 9 个特征值,即9 个相互独立的新的综合性指标,就能够比较全面地反映出红葡萄的理化指标。【2】
方案二:先聚类再简化
出于对每种物质作用的考虑,先对葡萄的理化指标进行聚类(被聚为一类的指标之间相关性
大,不同类的指标相关性小),得到大致分为 4 类: 酚类,酸类,糖类以及果实的基本性质类.然后利用主成分分析法结合相关性分析得到最终代表这四类的指标: 总酚,可滴定酸,总糖,果实基本性质类。实现变量因子的降维。
通过对简化后的酿酒葡萄理化指标对葡萄进行聚类,对酿酒葡萄分级结果如下
方案三:所有因素重新整合对附件 2 的数据进行处理,凡是测量 3 次的指标计算出平均值作为该指标量.然后取酿酒葡萄的一级理化指标作为指标得到两组数据,它们分别是 27 个红葡萄样品 30 个指标的数据和 28 个白葡萄样品30 个指标的数据。由于两组品酒员间评分差异,利用 min-max 标准化方法对两组数据进行标准化,这一步是整理数据组,便于之后的统一运算。
然后运用软件得出各指标间的相关系数矩阵,由得到的相关系数矩阵可知,指标之间存在较强的相关关系,可进行因子分析。按照特征值≥ 1 的原则选取公因子.由结果可知有 8 个满足条件的特征值,它们对样本方差的累积贡献率达到 83.043%,代表了绝大部分的信息。但由于 8 个公因子在数据上的载荷值相差不大,不能明确的解释各个公因子的含义,所以需要进一步进行因子旋转,得到红葡萄旋转成分矩阵,可以看到,旋转后的因子系数已经明显向两极分化,可对公因子进行相应的解释。至此变量组降维到8个全新指标变量。
【3】
(二)分级
降维后,可以得到权重评价模型(如方案三),可以划分等级分数段进行分级;也可以按新的变量因子进行聚类分析,也可以分级。(如方案二)
问题三
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。方案一:
首先对 27 个红葡萄的理化指标,6 个红葡萄酒的理化指标,做出相关系数矩阵. 剔除影响程度低的指标后,列出对红葡萄酒有显著影响的葡萄指标如下表:
建立多元线性回归模型,线性回归模型的一般形式为: Y = β0+ β1X1+ … + βkXk+ ε
得到以酿酒葡萄的理化指标为解释变量,每个葡萄酒理化指标为响应变量的函数回归方程,得到 9个回归方程。: 例:红葡萄酒中花色苷与红葡萄理化指标关系回归方程
y = 0.5900x1+ 0.2029x2+ 0.1540x3+ 0.1624x4-0.1780x5+ 0.1528x6+ 0.0320x7+ 0.0005 x1为花色苷,x2为苹果酸,x3为褐变度,x4为 DPPH 自由基,x5为总酚,x6为单宁,x7为果梗比.
关系式中看出一系列定性结论。
例: 红葡萄酒中花色苷主要来自于红葡萄中的花色苷,其含量与总酚含量呈负相关 方案二.
提取葡萄和葡萄酒中相应的指标,例:下表是各种红葡萄中,总黄酮在函数模型中的权重系数以及其排列。
以上是27种葡萄与葡萄酒总黄酮权重排名的折线图,可以以此图得出一系列定性结论。例:红葡萄酒中的指标与红葡萄的相应指标相差不大,葡萄酒中的相应指标与葡萄的相应指标有着近似定量的关系.满足这种情况的葡萄酒的理化指标有: 花色苷、总酚、白藜芦醇、总黄酮、DPPH 半抑制剂.
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
(一)由理化指标评价葡萄酒质量———逐步多元回归模型
葡萄的理化指标对评价葡萄酒质量影响并不显著,所以使用逐步分析法,自动选择最优自变量,得到回归方程.
(1)红葡萄酒和葡萄的理化指标对红葡萄酒质量影响的回归方程为:
y = - 0.03341x1+ 0.06279x2-0.01282x3+ 0.09751x4+ 0.88596 x1为苹果酸,x2为葡萄总黄酮,x3为白藜芦醇,x4为固酸比.
(2)白葡萄酒和葡萄的理化指标对白葡萄酒质量影响的回归方程为: y = 0.29873x1+ 0.09661x2-0.04515x3+ 0.64981 x1为 PH 值,x2为可滴定酸,x3为果穗质量.
(二)论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量
通过多元回归分析模型的预测功能,本文将数据代入方程计算得到葡萄酒质量的计算值,并计算得
出相对误差,见表 7.
从表中易见,误差很小,则能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.【1】
结语
对于葡萄酒的评价模型,可以抽象出两个特点:(1)数据处理、(2)评价模型。对于此次的求解,本文参考了5篇论文以及在搜狗百科、百度文库中屡次翻查,寻找一些专业名词的解析。大多是统计上的概念。这也体现了第一个数据处理的特点。本题主要是参杂了许多数据统计方面的手段与概念,比如t检验、显著差异性、聚类等。统计专业的学生会有极大优势。
本题中我认为的几大要点如下:
(1)第一问中显著差异性的检验,可以用专业的软件如(MATLAB、SPSS等)进行方差分析、t检验、符号秩检验
(2)第二问中理化指标太多,需要降维,而降维的方法也有很多,因子分析、主成分分析、聚类分析。
(3)对于酿酒葡萄的分类的手段有聚类分析、建立评价函数。
(4)对于葡萄与葡萄酒理化指标建的关系,有建立葡萄酒单一指标与葡萄各指标函数模型的,也有画折线图得出定性评价得。
(5)第四问,是用葡萄与葡萄酒的理化指标建立评价葡萄酒质量的模型。采用了逐步多元回归模型。
从本题中,给予了一般性的数据分析的方法以及评价模型的运用模板。相信以后遇到类似有关数据统计以及评价类模型,类似的方法技巧会大有长进。唯一的遗憾是关于软件运用上还是没有熟悉。
参考文献
【1】葡萄酒评价体系的数学模型,聂艺轩,李爽,杨慧,中央民族大学学报(自然科学版),2013.3第 22 卷
【2】葡萄酒的评价及分类,盖晓华,郭学军,南阳理工学院学报,2012.7第4 卷第4 期 b 【3】葡萄酒的评价,潘晓岚,王秋芳,黄祥威,中央民族大学学报(自然科学版),2013.3第 22 卷 【4】葡萄酒评价中显著性差异判别,王恰恰李娟郭淑俊,Journal of Henan Science and Technology 2013.NO06 【5】多元回归分析的逐步回归预测模型,郭会礼,数学教学与研究,百度文库