资源预览内容
第1页 / 共48页
第2页 / 共48页
第3页 / 共48页
第4页 / 共48页
第5页 / 共48页
第6页 / 共48页
第7页 / 共48页
第8页 / 共48页
第9页 / 共48页
第10页 / 共48页
亲,该文档总共48页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1. Introduction1. Introduction主成分分析与主成分回归 Principal Component Analysis and Regression2. PCA2. PCA3. PCR3. PCR1. Introduction1.1 1.1 ChemometricsChemometrics1.21.2Necessary KnowledgeNecessary Knowledge1.1 Chemometrics1.1.1. 1970S发展1.1.2. 交叉学科1.1.3. 现代仪器1.1.4. 一个例子1971:瑞典人S. Wold 基金项目定名时首提 1974:S. Wold 何B.R. Kowalski倡议在西雅图首开学术会 议新创学术刊物J. Chem. Info. Comp. Sci.J. ChemometricsChemom. Intell. Lab. Syst. 化学计量学与计量关系 Chemometrics Stoichiometry需要化学计量学 获得更多信息BACK应用数学、统计学、与计算机 科学的手段设计或优化量测方 法,并通过解析数据最大限度 地获取化学及相关信息。 化学 分析化学 数学 统计学 计算机科学 接口A New trend in Analytical Chemistry - -Hyphenated Instrument (聯用儀器)Separation InstrumentSignal InstrumentHPLC DAD (diode-array detector) GC MS (Mass-spectrometer)HPLC-DADvGet more data3D chromatogramHPLC chromatogram of nuclueside of Cordyceps Sinensis (冬蟲草) at one wavelengthGC-MSGC chromatogram of peptic powder (平胃散)Mass spectrum taken at retention time 10.2 minutesBACK Two-way data containing both chromatography and spectra; Data matrix with more than 80 Megabytes; Data base of lots of chemical standards 梁逸曾教授的经历 美国标准局16组分PAH混合物标样(Sulpeco) 已知峰9为苯并a蒽和屈,峰14为苯并芘和二苯并蒽的二组分重叠峰BACKNext 芴芴、苊、菲三混合、苊、菲三混合Peaks 5 and 6 in the plot峰5、峰6的演进特征投影图 峰5的前5个特征值依次为16382,2436,1294,22,11分辨所得的芴、苊、菲、蒽的色谱与光谱 化学学报 1998,中国科学 1998,ChemLab. 1999BACK线性代数1.2 Necessary Knowledge on Linear Algebra1.2.1 矢量Vector1.2.2 线性相关1.2.3 矩阵Matrix1.2.3 秩Rank一组溶液的光谱集合一条光谱同物质不同浓度的光谱混合溶液中的物种数BACK矢量:n个有顺序的数a1, a2, an组成的数组。k11+ k22+ + kmm=0线性组合:k1+ k2。 就称为,的行矢量:(a1, a2, an);列矢量t 。问:由,组成的矩阵, rank最大为几? 1 =( 1 2 3 4 5 6 )2 =( 6 5 4 3 2 1 )3 =( 1 1 1 1 1 1 )1+ 23 =0Grade dik received by student i from professor k is矩阵: 一组相同大小的矢量组合 经典例子: 教授给学生打分True score of student iRelative loading(importance) given by professor kj: factors (i,e., subjects)chem., physics, math., etc. Four students three professor two subject: Chemistry and English Professors1 2 3Students1 2 3 4Students1 2 3 4Professors1 2 3factors1 21 2Factors3教授给4学生写留学推荐信S is the matrix of true scores, called the score matrix L is the matrix of importance, called the loading matrix得分矩阵载荷矩阵矩阵的秩:对于A(mn), 其秩是A中最大线性无关的行数(或列数)。秩组分数?秩为几?三种组分,吸收光谱各不相同(s1, s2 ,s3)6组溶液,各组分浓度不同吸光度矩阵A(206)Rank =Number of Rank =Number of EigenvalueEigenvalue秩秩= =不为不为0 0的特征值的数目的特征值的数目矩阵: 一组不同浓度组合的混合溶液测得的光谱集合矢量: 一条光谱Eigenvalue 特征值奇异值分解法:Y=USVtS: 对角矩阵,收集了Y的特征值U: 标准列正交矩阵(Scores Matrix)Vt:标准行正交矩阵(Loadings Matrix)用Matlab 很方便!一句话!BACK2. PCA 主成分分析Principal Component Analysis2.1 2.1 目的目的1 12.2 2.2 基本步骤基本步骤2 22.3 2.3 应用实例应用实例3 32.1 主成分分析(PCA)的目的BACK现代仪器获得 两维数据(矩阵)矩阵处理 确定秩为多少确定复杂分析体系 中的物种数PCA的目的-定性 有几种物种species定性2.2 PCA的步骤BACK矩阵分解真实误差法收集特征值特征值比值法Y=USVt在S中比较RSD与REMaxBACKNIPALS分解矩阵分解奖金10000元=10000150002100100110000Y=TP奇异值(SVD)分解 Single Value DecompositionY=USVtS: 对角矩阵,收集了Y的特征值U: 标准列正交矩阵(Scores Matrix)Vt:标准行正交矩阵(Loadings Matrix)用Matlab 很方便!一句话!怎么分解? 看了头大!分解成正交矩阵的乘积Y(mn)有d个主成 分真实误差法-确定主成分数d+表示来自主因子0表示来误差=真实误差RE (Real Error,可以知道)RE=RSD (剩余标准偏差) Residual Standard Deviation确定或设定RE d=1n-1计算RSD(d) d=1 RSD(d)REYES此时d即为主成分数Nod=d+1RSD与实际误差 是否吻合判断标准BACK相邻特征值比值法出现最大值时 相应的d 表示最小成分信号的表示最大噪声信号的 显著差异BACK2.3 PCA的应用实例BACK混合色素中 组分数的确定反应过程中 组分数的确定一组一组食用色素混合溶液食用色素混合溶液测得吸光度矩阵测得吸光度矩阵Y Y151566ddd/d+1 RSD14.6084.10.1174 21.1301.80.0599 30.614564.00.0017 40.00961.150.0015 50.00841.160.0013PCA结果组分数 nc=3722722的噪声水平的噪声水平0.0020.0023 0.6145 64.0 0.0017同样的样品同样的样品用用AgilentAgilent 8453 8453ddd/d+1 RSD15.73611.70.0464 20.4902.50.0195 30.19964.30.0004 40.00312.10.0003 50.00151.90.0002PCA结果组分数 nc=3噪声水平噪声水平0.00020.00023 0.199 64.3 0.0004实际上有3种色素 胭脂红柠檬黄日落黄反过来,已知主成分数时PCA: 通常可以正确判定主成分数根据RSD判断仪器的噪声水平判断操作者的操作水平使用7220.00100.0040BACK实例讨论-for a chemical reaction三种化学成分A、B、C,光谱线性无关Model 1:Consecutive 1st order reactionResult: Rank=number of component=3Matrix two-way data 光谱矩阵 S动力学矩阵 Q两维数据矩阵YY = QST日落黄电解降解最终产物 无吸收有中间体吗?日落黄电解降解ddd/d+1 RSD14.1476.000.025520.69125.800.001230.02682.350.000740.01141.180.000550.00970.0003PCA 结果组分数 d=2PCA确定组分数nnn/n+1 RSD123.06010.60.0617122.1862.40.0241130.910215.70.0001440.0043.50.0000850.0011.20.0000760.0010.00007最终产物 有吸收d=3实例讨论三种化学成分A、B、C,光谱线性无关Model 2:nc=3, rank=2Y = QST实例讨论Model 3:Parallel reactionnc=3, rank=?A CBo1o2o1= or o2o1= o2=1k2qB-k1qC=0 线性相关 rank=2实例讨论Model 3:Parallel reactionnc=3, rank=?A CBo1o2o1=0, o2=1dA/dt=k1+k2AdB/dt=k1dC/dt=k2A线性无关 rank=3PCA确定组分数Y = load(E:Hp8453BBOH15.txt); U, S, V = svd(Y); lmd=diag(S); n=size(lmd,1); for k=1:n-1sumlmd=0;for j=(k+1):nsumlmd=sumlmd+lmd(j)*lmd(j); endRSD(k)=sqrt(sumlmd/(nw*(nt-k); endPCA:Conclusions 根据矩阵的秩确定化学成分数组分无吸收No!谱线性相关亏秩! 某组分信号太弱复杂!好大学问! BACK3. PCR 回归Principal Component Regression3.1 3.1 概念概念1 13.2 3.2 基本步骤基本步骤2 23.3 3.3 应用实例应用实例3 33.4 3.4 提醒提醒3 33.1 PCR:概念BACK主成分分析PCA PCR多元校正之一因子分析FA 主成分回归PCR 多元校正MC 相似概念常常混用步骤略异侧重不同解决多组分同时测定问题定 量3.2 PCR:基本步骤K-矩阵法 K-Matrix Method 数学模型实验测量数据矩阵 Size: nwns吸光系数矩阵 Size:nwnc混合浓度矩阵 Size:ncns建模/校正See next预测已知K,解出未知样浓度单样品多样品3.2 PCR:基本步骤SVD分解SVD分解分离重组广义 逆建模未知样 预报与K矩
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号