资源预览内容
第1页 / 共52页
第2页 / 共52页
第3页 / 共52页
第4页 / 共52页
第5页 / 共52页
第6页 / 共52页
第7页 / 共52页
第8页 / 共52页
第9页 / 共52页
第10页 / 共52页
亲,该文档总共52页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
市场研究的数据分析方法第一节 线性回归分析一、线性回归方程的基本模型 线性回归方程从样本资料出发,一般利用最小二乘法 ,根据回归直线与样本数据点在垂直方向上的偏离程 度最低的原则,进行回归方程的参数的求解。 线性回归分析是考察变量之间的数量关系变化规律, 它通过一定的数学表达式-回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影 响程度,为预测提供数学依据。1、一元线性回归模型 模型是:式中:为被解释变量(因变量);为解释 变量(自变量),是随机误差项,i为观测值 下标,n为样本容量, 与 是待估参数,称 为回归常数,为回归系数。2、多元回归模型多元线性回归模型中自变量的个数在2个以上 ,模型的一般形式为:i=1,2n其中, 为被解释变量(因变量),为解释变量(自变量), 是随机误 差项,i为观测值下标,n为样本容量, 为k+1个待估参数, 为回归常数, 称为回归系数。在应用线性回归模型时,必须满足以下假设: (1)解释变量 是确定性变量,而且解 释变量之间不相关。 (2)随机误差项具有0均值和同方差。 (3)随机误差项在不同样本点之间是独立的,不 存在序列相关。 (4)随机误差限于解释变量之间不相关。 (5)随机误差项服从0均值和同方差的正态分布。二、线性回归方程的统计检验 1、回归方程拟合优度检验 2、回归方程的显著性检验 3、回归系数显着性检验 三、回归分析假设条件的检验 1、残差分析 2、多重共线性 3、误差项的序列相关 四、线性回归分析的基本步骤1、确定回归中的自变量和因变量。2、从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程。3、对回归方程进行各种统计检验。4、利用回归方程进行预测。 例:Checkers Pizza公司是休斯敦附近Westbury镇上仅有的从事比萨饼送货业务的两家公司之一,其直接竞争对 手是欧文公司,提供相同的产品与服务。另外麦当劳也 是它的一个重要竞争者。在过去的24个月中,该公司的 销售量(Q)、价格(P),小镇上居民的人均收入(M),欧文 公司产品的价格(P欧文)以及麦当劳产品的价格(P麦 当劳)。假定下个月公司产品价格为9.05,人均收入为 26614元,欧文公司产品的价格10.2元,麦当劳产品的价 格为1.15元,请预测该公司下个月的销售量。五、实例分析首先Checkers Pizza公司根据资料估计 下面的线性需求方程的参数: Q=Q=a+bP+cM+dPa+bP+cM+dP欧文欧文+ +ePeP麦当劳麦当劳式中: Q比萨饼的销量; P比萨饼的价格 M小镇居民的人均收入 P欧文欧文公司产品的价格 P麦当劳麦当劳产品的价格下面是SPSS11.0的输出结果: 从上面的输出结果可以看出,模型可以解释 97%的比萨饼销售量的变化;模型整体非常显 著,F统计的相伴概率值P=0.000;四个参数b 、c、d、e非常显著,T统计的相伴概率值P都 远小于0.01。 所以,回归方程为:Q= -Q= -343.748 343.748 - -195.895P+0.0742M+174.403 P 195.895P+0.0742M+174.403 P欧文欧文 +81.057 +81.057 P P麦当劳麦当劳 该公司下一个月比萨饼的销量为;Q= -Q= - 343.748 343.748 - -195.895*9.05+0.0742*26614+174.403 *10.2 +81.057 *1.15 195.895*9.05+0.0742*26614+174.403 *10.2 +81.057 *1.151730.28721730.2872第二节 判别分析 一、判别分析法的基本思想 判别分析包括以下两步:1、分析和解释各类指标之间存在的差异,并建立判别函数。2、以第一步的分析结果为依据,将对那些未知分类属性的案例进行判别分类。二、判别分析基本模型与统计术语(一)假设条件1、每一个类别都取自一个多元正态总体的样本2、所有正态总体的协方差矩阵或相关矩阵都相等(二)基本模型 1、先验概率 2、后验概率 3、判别系数4、结构系数 5、分组的矩心 6、判别力指数7、残余判别力 (三)统计术语三、分析的基本步骤 判别分析一般都是通过现成的统计软件进行分析。一般而言,利用统计软件的判别分析具体包括以下步骤:确定研究 的问题获取判别分 析的数据进行判别 分析评价和解释 分析结果 某公司生产一新产品,该公司在新产品末大量上市以前,进行了一次市场调查。公司将新产品寄给十五个代理商,并附意见调查表,要求对该产品给予评估并说明是否愿意购买。评估的因素有:式样、包装及耐久性。评分用10分制,高分表示特性良好,低分则较差。其中有三位代理商没有表明自己的购买意愿。 那么这些代理商是属于“非购买组”还是“购买组”? 四、实例分析以下是SPSS11.0的部分输出结果: 表中,式样 、包装和耐用性的标准化系数分别为 0.91、0.083、0.254。因而,式样是最重要的判别变量 ,其次是“耐用性”,最后是包装。表中最大概率组一栏是判别分析得出的组别。13、15号代理商属于“非购买组”, 14号代理商属于“购买组”。 第三节 聚类分析一、聚类分析的基本思想 聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。 样品聚类是对事件进行聚类,或是说对观测量进行聚类,是对反映被观测对象的特征的变量值进行分类。 变量聚类则是当反映事物特点的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。二、距离与相似系数 (一)常用的距离指标有 1、欧式距离 2、欧式距离的平方 3、曼哈顿距离 4、切比雪夫距离 (二)常用的相似系数指标主要有 1、余弦系数2、皮尔逊相关系数 (三)定类数据的距离 1、卡方距离 2、法方距离 三、聚类方法 1层次聚类法 2迭代聚类法 四、聚类分析的主要步骤 确定研究 的问题计算 相似性聚类聚类结果的 解释和证实 某家具公司为了对市场进行的细分,对购买家具的顾客进行了一次市场调查。这次调查的指标有:喜爱的款式(老式为1,新式为2),图案(素式为1,格字为2,花纹为3);颜色(蓝色为1,黄色为2,红色为3,绿色为4)。调查样本为30人。 五、实例分析:顾客式样图案颜色12 3 456 7891011121314151617181920212223242526272829301 1 2 2 1 2 1 2 1 2 1 2 1 2 1 1 2 1 2 2 1 2 1 2 2 1 2 1 2 13 2 33121321323122321323231311321 2 4 3 2 3 2 4 1 1 4 3 2 2 4 3 2 4 1 4 3 4 3 2 1 4 2 2 4 3根据聚类结果,这30名顾客分为3类,可以较好的反映这些顾客对家具的偏好类型: 第一类: 1,9,13,17,24 第二类:2,3,4,5, 6,7,8,11,12,15,16,18,20,21,22,23,26,28,29,30 第三类: 10,14,19,25,27 第四节 因子分析一、因子分析的基本思想 因子分析是一项多元统计分析技术,其主要目 的就是简化数据。它通过研究众多变量之间的 内部依赖关系,探求观测数据中的基本结构, 并用少数几个假想变量来表示基本的数据结果 。这些假设变量是不可观测的,通常称为因子 。它们反映了原来众多的观测变量所代表的主 要信息,并能解释这些观测变量之间的相互依 存关系。 二、因子分析的数学模型和相关统计量(一) 数学模型 (二)相关统计量 1、因子载荷 2、共同度 3、因子的贡献 4、巴特利特球体检验 5、KMO指数 三、因子分析的基本步骤1、确定研究变量。2、计算所有变量的相关矩阵。3、构造因子变量。4、因子旋转。5、计算因子得分。四、实例分析 某公司为了了解消费者对牛肉、色、羊肉、猪肉及鸡等五种肉类食物的偏好倾向,进行了一次市场调查。请10位消费者对这五种肉类进行评分。评分采用十分制,分数越高表示越喜欢。调查结果列于下表。试用因子分析方法研究影响消费者选择食物的因素。 上表是SPSS11.0输出的旋转后的因子载荷矩阵。我们可以依此推断两个公共因子的含义。从表中的数据来看,鸡、鱼、牛肉在第 一公共因子的因子载荷值较高,而在第二公共因子的因子载荷值较 低,故第一公共因子反映鸡、鱼、牛肉的公共特性。第一公共因子 可能代表脂肪少。而羊肉、猪肉在第二公共因子的因子载荷值较高 ,在第一公共因子的因子载荷值较低,这说明第二公共因子反映羊 肉、猪肉的公共特性,第二公共因子可能代表价格。因而我们可以 认为脂肪和价格是决定消费者肉类消费的主要因素。第五节 对应分析 一、对应分析的基本思想 对应分析,又称为相应分析,是在R型和Q型因子分析基础上,发展起来的一种多元相依的变量统计分析技 术。它通过分析由定性变量构成的交互汇总表来揭示 变量间的关系。当以变量的一系列类别以及这些类别 的分布图来描述变量之间的联系时,使用这一分析技 术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。 二、有关统计术语与资料格式(一)统计术语 1、列联表 2、主成分 3、惯量和特征值 4、卡方、似然比卡方、曼图汉斯泽鲁卡方 、法系数、列联系数 (二) 数据格式三、分析的步骤1、 确定研究的内容2、 获取分析资料 3、 对列联表作对应分析4、 解释结果意义5、 评价分析结果四、实例分析 某公司进行一次市场调查,得到轿车特征于一些用户特征的数据。如有: 轿车大小(大、中、小)、轿车类型(家用型、跑车、商用车)、 收入(一份收入、双份收入)、状态(已婚、已婚有孩子、未婚、未婚有孩子)、房子(租房、买房)等数据。现请分析它们之间的联系。1、已婚有孩子、家用车和中型车相关性较大。2、已婚和双份收入有联系,已婚、已婚有孩子和买房也有一定的联系。3、未婚、一份收入和租房之间关系紧密。4、跑车与小型车之间也有关系。从对应图可以推断出下面一些结论: 根据上面的结论根据上面的结论,我们在进行市场细分、制定营销战略方面可以充分利用这些信息。例如:面向已婚家庭应重点推销中型家用车。而那些未婚、一份收入、租房的消费者,因其经济条件方面的原因,他们难以成为轿车消费的目标顾客群。另外现没有适合双份收入、已婚的消费者的车型,应考虑开发新车型满足他们的需求。第六节 多维偏好分析一、主成分分析法简介 (一)主成分分析的基本思想 主成分分析法就是将原来众多具有一定相关性的指标(如p个指标),重新组合成一组新的相互无关的综合指标来代替原来的指标。 (二)主成分分析的数学模型 (三)主要统计术语1、偏好评分 2、特征值或惯量 二、分析的基本步骤1、确定研究的问题2、资料的收集3、主成分分析 4、偏好图并解释结果意义 三、实例分析 某心理学期刊作了一项市场调查,以了解自己刊物与现有的其它心理学刊物的相对定位。他们挑选10种心理学刊物,请39个专业心理学家根据他们对这些刊物的偏好按1-10的量表评分,其中“1”代表低评价,“10”代表高评价。 利用SPSS Categories PRINCALS过程的“非线性”主成 分分析方法对上表的资料进行分析,部分结果如下: 这些刊物表现为以下分组: 1)一个“硬”组,包括JEXP,PMET,MVBR,JAPP,或许BULL 2)一个“发展”组,包括JEDP,HUDE 2、成份加载图表: 箭头指向相同的心理学家
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号