资源预览内容
第1页 / 共35页
第2页 / 共35页
第3页 / 共35页
第4页 / 共35页
第5页 / 共35页
第6页 / 共35页
第7页 / 共35页
第8页 / 共35页
第9页 / 共35页
第10页 / 共35页
亲,该文档总共35页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数据分析数据分析2011年7月5日报告人:孙 辉主要内容结 论数学建模简介数据分析方法数据分析工具应用实例数学建模简介数学建模:是利用数学方法解决实际问题的一种实践。即通过抽象、简化、假设、引进变量等处理过程后,将实际问题用数学方式表达,建立起数学模型,然后运用先进的数学方法及计算机技术进行求解。数学模型及分类按研究方法和对象的数 学特征分:初等模型、几何模型、优化模型、微分方程模 型、图论模型、逻辑模型、稳 定性模型、扩散模型等。按研究对象的实际领域(或 所属学科)分:人口模型、交通模型、环境模型、生态模型、 生理模型、城镇规划模型、水资 源模型、污染模型、经济模型、 社会模型等。模型玩具、照片、飞机、火箭模型地图、电路图、分子结构图水箱中的舰艇、风洞中的飞机数学建模过程在实际过程中用哪一种方 法建模主要是根据我们对研 究对象的了解程度和建模目 的来决定。机理分析法建模 的具体步骤大致可见上图。建模过程示意图数据分析数据分析:数据也称观测值,是实验、测量、观察、调查 等的结果,常以数量的形式给出。数据分析的目的是把隐 没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据的描述性分析:是从数据出发概括数据特征,主要包 括数据的位置特性、分散性、关联性等数字特征和反映数据整体结构的分布特征,它是数据分析的第一步,也是对 数据进行进一步分析的基础。数据分析问题变量求解:有些数据之间存在因果关系,这些因果关系可以用 数学模型来描述,如方程式,不等式等,如果知道了 结果数据,能否根据这些数学模型求出原因变量的值? 相关性分析:判断两组数据集(可以使用不同的度 量单位)之间的关系。回归分析:回归分析: 当一个结果与一个或多个 参数之间存在联系时,可以进行回归 分析,通常可由一个或多个自变量来 预测一个变量的值。相关性分析判断两组数据集(可以使用不同的度量单位)之间的关系 。相关系数(R):用来确定两个区域中数据的变化是否相关,以及相关的程度。|R|=0.8:非常高度相关回归分析:当一个结果与一个或多个参数之间存在联系时,可以进行回归分析,通常可由一个或多个自变量来预测一个变量的值。回归方程:表达参数与结果之间相互关系的数学方程式(数学模型)。线性回归:如果变量与结果之间具有线性关系,我们可以用线性方程式来描述它们之间的关系,这种回归方法叫线性回归.非线性回归:如果变量与结果之间不具有线性关系,我们必须用非线性方程式来描述它们之间的关系(如指数关系,对数关系等等),这种回归方法叫非线性回归.回归分析 MATLAB的应用Matrix Laboratory 是一个功能非常 强大的,非常著 名的数学软件, 他有惊人丰富的 库函数。 矩阵求解A=1,1,-3; 3,-1,-3;5,-9,-8;R=Rank(A)D=det(A)T=trace(A)A=inv(A)d,v=eig(A)X=AB数据函数处理x = -pi:0.01:pi; y1=sin(x); y2=cos(x); plot(x,y1,x,y2) plot(x,y1,r,x,y2,b) subplot(1,2,1) ; plot(x,y1) subplot(1,2,2) ; plot(x,y2) ; title(正弦函数,余弦函数); xlabel(x) ; ylabel(y) ;ezmesh 画网线图的简捷指令 x=-10:0.1:10;y=-10:0.1:10;ezmesh(x2+y2)*exp(-(x2+y2)最大数,最小数,平均数,相关系数,方差,标准差a=rand(1,8) ; max(a)min(a)mean(a)var(a) ;std(a) ;abs(min(min(corrcoef(a,b) b=rand(1,8) ; max(b)min(b)mean(b)var(b) ;std(b) ;p=polyfit(x,y,n),需要曲线的x, y值以及曲线的阶数曲线的阶数:如果曲线的阶数选择的过小,拟合效果不好;如果曲线的阶数过高,虽然数据点上看到效果好,数据点 之间会出现有数据振荡的问题,阶数不宜过高,小于5阶。 灵活使用拟合!最小二乘法的多项式拟合Mat lab实现x=0.5,1.0,1.5,2.0,2.5,3.0; y=1.75,2.45,3.81,4.80,7.00,8.60; p=polyfit(x,y,2) x1=0.5:0.05:3.0; y1=polyval(p,x1); plot(x,y,*r,x1,y1,-b) 即所得多项式为y=0.5614x2+0.08287x+1.15560 cftool工具箱也具有此功能Excel 应用Excel 提供了一组数据分析工具,称为“分析工具库”,在建立复杂统计或工程分析时可节省步骤。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或工程函数,在输出表格中显示相应的结果。其中有些工具在生成输出表格时还能同时生成图表。安装“分析工具库:要使用查看可用的分析工具,单击“工具”菜单中的“数据分析”命令。如果“工具”菜单中没有“数据分析”命令,则需要安装“分析工具库”。相关性分析相关性分析R=0.922518580.8说明两个广告费和销 售量具有很高的相关 度。可以由一量来推 出另一个量。给图表增加趋势线进行回归分析例4(线性回归)、 我们收集了某厂家同一车型中旧车的车龄及其售价 数据,请使用给图表增加趋势线,求车龄对售价的回归方程,并计算 车龄为6.5年的旧车售价是多少?例(非线性回归)、 我们收集了年龄与月收入关系的数据,请绘 制该数据的散点图,并求年龄对月收入的回归方程式。非线性回归有些数据间并不是简单的线性关系,如果用线 性模式求其回归方程式,判定系数(R2)很小 根本不具有任何解释力。因此要引入非线性回 归,如多项式、指数、对数等回归方法。加入趋势线可以进行简单的回归分析,但要获得更多的统计数据,可以使用数据分析工具,求简单相关系数、判定系数、用F检定判定变量与自变量间是否有回归关系存在、用t检定判定各回归系数是否不为0、计算回归系数的置信度、标准残差等。使用“数据分析工具”进行回归分析例 、根据广告费与销售额统计数据使用分析工具进行回归分 析。应用实例高等教育学费优化模型与分析高等教育学费问题已成为社会关注的热点问题,根据普通高等学校生均实际学费的特点,在分析学费影响因素:生均拨款、培养费用、家庭收入等的基础上,对学费问题进行分析研究 。模型准备问题重述学费问题涉及到每一个大学生及其家庭,是一个敏感而又复杂的问题:过高的学费会使很多学生无力支付,过低的学费又使学校财力不足而无法保证质量。对于以上种种问题请根据中国国情,收集诸如国家生均拨款、培养费用、家庭收入等相关数据,并据此通过数学建模的方法,就几类学校或专业的学费标准进行定量分析,得出明确、有说服力的结论 。我们到底应如何评价目前的收费呢?我们究竟应按什么标准来评价呢?这个标准是主观还是客观的呢?如果是客观的,那么制定学费时应考虑哪些影响因素呢?有没有可能根据这些影响因素来构建一个学费制定标准的量化模型呢?如果可能具体操作又如何呢? 高等教育学费与城乡家庭收入之间的关系模型 由离散样本数据点我们利用常见的最小二乘原理拟合生均学费和农村家庭人均纯收入(或城镇居民人均可支配收入)的关系。通过Matlab计算可得如下模型:生均学费和农村家庭人均纯收入的关系模型:利用Matlab软件作出拟合曲线图像如下:图一 用四次多项式对样本点拟合 生均学费和城镇居民人均可支配收入的关系模型:利用Matlab软件作出拟合曲线图像如下:图二 用三次多项式对样本点拟合生均学费与国家生均预算内教育经费之间的关系模型 利用常最小二乘原理拟合1993年2005年生均学费与国家生均预算内教育经费的关系。通过Matlab计算可得如下模型:标准模型建立由经济学模型启发:以能力支付原则和利益获得这两个最基本的原则来制定学费.量化模型有两个基本假定:假定一: 劳动力市场的自由竞争.假定二: 各专业生均培养成本和收益率能够较为科学地计算.学费标准的制定还必须因地因时因专业。因此我们可以进一步构建以下两个量化模型。模型评价与分析模型的构成充分考虑了能力支付原则和利益获得原则,对于专业平均学费和地区专业平均学费。相应的考虑了学校的差异性、地区的差异性和专业的差异性,比较符合客观实际。建议进一步加强对我国普通高校学费的管理继续增加国家财政对普通高校的投入适当控制普通高校招生规模的增长速度提高普通高校的科技创新能力和科技成果转化水平奖学金制度应进一步健全, 适当地恢复助学金制度勤工助学制度应进一步完善学生贷款制度应继续健全和完善 怎样撰写数学建模的论文?1、摘要:问题、模型、方法、结果2、问题重述4、分析与建立模型5、模型求解6、模型检验7、模型推广8、参考文献9、附录3、模型假设www.themegallery.com
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号