资源预览内容
第1页 / 共66页
第2页 / 共66页
第3页 / 共66页
第4页 / 共66页
第5页 / 共66页
第6页 / 共66页
第7页 / 共66页
第8页 / 共66页
第9页 / 共66页
第10页 / 共66页
亲,该文档总共66页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第五章 市场调查的数据分析l市场调查数据分析的基本方法l假设检验法l方差分析法l聚类分析法l判别分析法天马行空官方博客:http:/t.qq.com/tmxk_docin ;QQ:1318241189;QQ群:1755696325.1 市场调查数据分析的基本方法l频数、频率分析l数据集中趋势分析算术平均数中位数众数l数据分散趋势分析全距(极差)四分位差标准差5.1.1 频数、频率分析(1)l例1:假设有样本数据ABCDEFGHIJ 11221465332 26112232543 34413314335 41345642463 53521121146 62634551322 76366236511 84153364634 95132522262 1032523414455.1.1 频数、频率分析(2) 5.1.1 频数、频率分析(3)5.1.2 算术平均数l未分组数据的平均数计算l分组数据的平均数计算l上例的计算结果5.1.3 中位数的计算(1)l未分组数据的中位数计算对所有数据进行排序,当数据量为奇数时,取中间数为 中位数,当数据量为偶数时,取最中间两位数的平均数 为中位数。上例中数据量为100,是偶数,所以应取排 序后第50位数和第51位数的平均值作为中位数。第50位 数是3,第51位数也是3,所以中位数为3。5.1.3 中位数的计算(2)l分组数据的中位数计算下式中L为中位数所在组的下限值,fm为中位数所在组的 组频数, Sm-1为至中位数组时累计总频数,h为组距。5.1.3 中位数的计算(3)l例2:假设有分组数据如下(销售额单位为万元)年销售额组中值商店数目累计频 数 80-908533 90-10095710 100-1101051323 110-120115528 120-130125230 合计305.1.3 中位数的计算(4)l依据公式例2的中位数为5.1.4 众数的计算l未分组数据的众数为出现次数最多的数。l分组数据的众数依据下式计算获得。表达式中1表示众数所在组与前一组的频数差,2表示众数所在 组与后一组的频数差。依据公式,例2分组数据的众数为104.29万 元。5.1.5 全距(极差)的计算l全距指的是样本数据中最大值与最小值之间的距离,因 而也叫极差。例1中最小值为1,最大值为6,因而全距 为6-1=5。5.1.6 四分位差的计算l四分位差是一种按照位置来测定数据离散趋势的计量方 法,它只取决于位于样本排序后中间50%位置内数据的 差异程度。即第一个四分位与第三个四分位数据之间的 差异。例2的四分位差计算过程如下5.1.7 标准差的计算(1)l未分组数据的标准差计算5.1.7 标准差的计算(2)l分组数据的标准差的计算5.2 市场调查数据的假设检验l参数假设检验U检验t检验l非参数检验5.2.1 U检验l当样本容量大于30时,可以采用U检验。均值检验百分比检验双样本平均数差异的检验双样本百分比差异的检验均 值 检 验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接 受H0,否则拒绝H0 。百 分 比 检 验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接 受H0,否则拒绝H0 。双样本平均数差异的检验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接 受H0,否则拒绝H0 。双样本百分比差异的检验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接 受H0,否则拒绝H0 。5.2.2 t检验l当样本容量小于30时,不可以使用U检验,而需 要使用t检验。均值检验均值差异的检验百分比差异的检验均 值 检 验(t)l假设有选取统计量设定显著性水平 查表得到 根据t的计算结果,比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0 。均值差异的检验(t)l假设有选取统计量设定显著性水平 查表得到 根据t的计算结果,比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0 。百分比差异的检验(t)l假设有选取统计量设定显著性水平 查表得到 根据t的计算结果,比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0 。5.2.3 非参数检验(X2)l在市场调查中常获得一些量表数据,对量表数据 求取平均数与方差都是毫无意义的。对量表数据 的处理更适宜于采用非参数检验方法。非参数检 验中常用的方法是X2检验。 X2检验的统计量是上述统计量中, 表示第 类别在样本中实际出现 的次数,表示期望出现的次数, 为类别数。5.3 市场调查的方差分析l单因素方差分析l双因素方差分析5.3.1 单因素方差分析(1)l单因素方差分析研究一个因素在不同水平下对研究对象 影响的显著性。单因素方差分析的数据表如下:试验 数试验 水平 A1A2An 1 2 M 平均值5.3.1 单因素方差分析(2)l单因素方差分析的一般形式方差来源平方和自由度方差F组间 方 差组内方 差 方差总 和5.3.1 单因素方差分析(3)l单因素方差分析的数学计算表达式5.3.1 单因素方差分析(4)l例试验 点月销售量(吨) 包装1包装2包装3 1151519 2101012 391216 451116 5161217 合计5560805.3.1 单因素方差分析(5)5.3.1 单因素方差分析(6)l查表求得 的值。比较 与 的 大小。若有 ,则认为因素无显著性影响 。反之则认为影响较显著。本例中n=3, m=5。5.3.2 双因素方差分析(1)l双因素方差分析分析两个同时存在的因素在不同水平状态下独立作用对分 析对象的影响的显著性。双因素分析的常用数据表因 素 A行总计 观察值A1A2As 因 素 BB1B2Br列总计5.3.2 双因素方差分析(2)l双因素方差分析表方差来源平方和自由度方差F因素A因素B误差总计5.3.2 双因素方差分析(3)l双因素方差分析的数学表达式5.3.2 双因素方差分析(4)l例销 地销 量行总计 包装 A1包装 A2包装 A3 B120192160 B216151445 B39101130 B487621 列总 计535152156(总 )5.3.2 双因素方差分析(5)5.3.2 双因素方差分析(6)5.3.2 双因素方差分析(7)l查表求得 的值。比较 与 、 的大小。若有 ,则认为因素A无显著性影响;反之则认为影响较显著。若有 ,则认为因素B无显著性影响;反之则认为影响较显著。5.4 因子聚类分析l距离聚类法最短距离法最长距离法l相关系数聚类法5.4.1 最短距离聚类法(1)l计算样本间距离,并列出初始距离矩阵。l选取初始距离矩阵中的最小值,并对该值对应的样本进 行类合并。l根据最小值原则计算新合并样本与其他样本之间的距离 ,列出新的距离矩阵。l重复上述步骤,直至所有样本被全部合并为一类。5.4.1 最短距离聚类法(2)l例 假设有样本数据如下,请对样本进行分类。样本序 号样本式 样样本包 装样本性 能 1444 2366 3633 4245 51225.4.1 最短距离聚类法(3)l初始距离矩阵 5.4.1 最短距离聚类法(4)5.4.2 最长距离聚类法(1)l计算样本间距离,并列出初始距离矩阵。l选取初始距离矩阵中的最小值,并对该值对应的样本进 行类合并。l根据最大值原则计算新合并样本与其他样本之间的距离 ,列出新的距离矩阵。l重复上述步骤,直至所有样本被全部合并为一类。5.4.2 最长距离聚类法(2)l同上例l初始距离矩阵5.4.2 最长距离聚类法(3)5.4.3 相关系数聚类法(1)l被聚类的对象 、 的相关系数可以由下式计算获得5.4.3 相关系数聚类法(2)样本相关系数表X1X2X3X4X5X6X7X1-0.530.470.380.680.530.64X20.53-0.600.480.650.700.42 X30.470.60-0.670.570.440.52X40.380.480.67-0.360.780.50X50.680.650.570.36-0.590.62X60.520.700.440.780.59-0.52X70.640.420.520.500.620.52-5.4.3 相关系数聚类法(3)找出每列中最大的相关系数X1X2X3X4X5X6X7 X1-0.530.470.380.680.530.64 X20.53-0.600.480.650.700.42 X30.470.60-0.670.570.440.52 X40.380.480.67-0.360.780.50 X50.680.650.570.36-0.590.62 X60.520.700.440.780.59-0.52 X70.640.420.520.500.620.52-5.4.3 相关系数聚类法(4)l找出各列最大相关系数中的最大值X1X2X3X4X5X6X7X1-0.680.64 X2- X3- X40.67-0.78 X50.68- X60.700.78- X7-5.4.3 相关系数聚类法(5)l合并X2、 X3、 X4、 X6。l重复上述步骤,合并X1、 X5、 X7。X1X5X7 X1-0.680.64 X50.68-0.62 X70.640.62-5.5 因子判别分析l判别分析法的目的是判别给定样本是否属于假定的类型 。判别分析法的核心是建立判别函数。常用的判别函数 为多元线性判别函数。其形式如下5.5.1 判别函数的建立(1)l例假设有下列原始数据,请建立判别函数,判别假定的分组是否正确。产品各指标表相应评 价值 产品款式X1产品包装X2产品性能X3 预定销售组A1987 21074 3763 4645 5866 6855 预定销售组B7536 8243 9145 104525.5.1 判别函数的建立(2)l第一步:计算A、B两组相应指标数据平均值5.5.1 判别函数的建立(3)l第二步:计算组间平均值的差。l即有5.5.1 判别函数的建立(4)l第三步:计算A、B两组资料的离差矩阵。5.5.1 判别函数的建立(5)l第四步:计算离差矩阵CA、 CB的共变异矩阵。5.5.1 判别函数的建立(6)l第五步:计算A、B两组资料的联合共变异
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号