资源预览内容
第1页 / 共14页
第2页 / 共14页
第3页 / 共14页
第4页 / 共14页
第5页 / 共14页
第6页 / 共14页
第7页 / 共14页
第8页 / 共14页
第9页 / 共14页
第10页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第一1、 computational biology计算机生物学是利用计算的方法对复杂生命现象和过程进行研究和预测的科学。它是理论与数据分析、数学建模和计算机模拟在生物学、行为学、社会群体系统中的应用与研究。它是数学、生物、物理、化学和计算机科学等高度交叉的学科,并与人类的生活与健康紧密结合。2、 the four choices, define a model for a computer simulation自由度、力场、外部环境、运动方程第二分子模型的代表:量子力学、量子/分子力学、分子力学、联合原子模型、粗粒化模型分子力学,又叫力场方法(force field method),是基于经典牛顿力学方程的一种计算分子的平衡结构和能量的方法。与量子力学不同,它求解的是Newton方程,而不是薛定谔方程。(用量子力学处理分子,计算量特别大,因此量子力学方法适用于处理小分子体系。分子力学计算量较小,更适合于大分子体系,可考虑额外效应)简单分子力场:分子力场是分子力学的核心;简单作用模型;力场的可移植性成键/非键相互作用:键长、键角、二面角、范德华作用、静电作用、交叉相互作用(五种类型,老师说一定会考)3、 Potential energy functions由于分子力学是经验的计算方法,不同的分子力学方法会采用不同的势能函数( Potential Energy Function, PEF)表达式,而且力场参数值也会不同。一般将分子的PEF分解成五部分:4、 polarizability effect将电介质放入电场,表面出现电荷。这种在外电场作用下电介质表面出现电荷的现象叫做电介质的极化。带电的配基会是蛋白质部分受到极化。5、 force field,two most popular force field分子力场并不计算电子相互作用,它是对分子结构的一种简化模型。一个分子的能量可以近似看作构成分子的各个原子的空间坐标的函数,简单地讲就是分子的能量随分子构型的变化而变化,而描述这种分子能量和分子结构之间关系的就是分子力场函数。传统力场、第二代力场、通用力场比较不同程序计算得到的能量值无意义AMBER力场:由Kollman课题组开发的力场,是目前使用比较广泛的一种力场,适合处理生物大分子。AMBER力场的势能函数形势较为简单,所需参数不多,计算量也比较小,这是这个力场的一大特色,但也在一定程度上限制了这个力场的扩展性。本力场用谐振子模型计算键长伸缩能和键角弯转能,用傅立叶级数的形式来描述二面角扭转能,选用Lennard-Jones势来模拟范德华力;用库仑公式来描述静电相互作用。CHARMM力场:由Karplus课题组开发,对小分子体系到溶剂化的大分子体系都有很好的拟合。第三6、 local minimum能量优化,寻找研究体系能量极小的状态,从数学角度看是处理多维函数的优化问题。优化的方法,降低体系能量到最靠近的一个最小。窄而深的最小值的统计学大小可能比高能下宽的最小值要少。7、 global minimum 全局优化研究的是多变量非线性函数在某个约束区域上的全局最优解的特性和构造寻求全局最优解的计算方法。由于很可能在一个全局优化问题里存在多个局部最优解,且它们不同于问题的全局最优解,因此人们无法借助于经典的局部优化方法求解这些问题。8、 steepest descents最速下降法又称为梯度法,是1847 年由著名数学家Cauchy 给出的。其优点是工作量少,存储变量较少,初始点要求不高;缺点是收敛慢,效率不高,有时达不到最优解。最速下降法从目标函数的负梯度方向一直前进,直到到达目标函数的最低点。梯度下降法的计算过程就是沿梯度下降的方向求解极小值。9、 conjugate gradients methods,compare共轭梯度法是求解特定线性系统的数值解的方法,其中那些矩阵为对称和正定。共轭梯度法是一个迭代方法,所以它适用于稀疏矩阵系统,因为这些系统对于像乔莱斯基分解这样的直接方法太大了。这种系统在数值求解偏微分方程时相当常见。共轭梯度法是介于最速下降法与牛顿法之间的一个方法,它仅需利用一阶导数信息,但克服了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点,共轭梯度法不仅是解决大型线性方程组最有用的方法之一,也是解大型非线性最优化最有效的算法之一。共轭梯度法是一个典型的共轭方向法,它的每一个搜索方向是互相共轭的,而这些搜索方向d仅仅是负梯度方向与上一次迭代的搜索方向的组合,因此,存储量少,计算方便。10、two methods for global energy minimization模拟退火是受金属热加工技术的启迪而发展起来的一种随机搜索算法。将一个优化问题比拟成一个金属物体, 将优化问题的目标函数比拟成物体的能量, 问题的解比拟成物体的状态, 问题的最优解比拟成能量最低的状态, 然后模拟金属物体的退火过程, 从一个足够高的温度开始,逐渐降低温度, 使物体分子从高能量状态缓慢的过渡到低能量状态, 直至获得能量最小的理想状态为止,从而得到优化问题的全局最优解。新状态接受概率仅依赖于新状态和当前状态,并由温度加以控制。 质量高;简单、通用、易实现。由于要求较高的初始温度、较慢的降温速率、较低的终止温度,以及各温度下足够多次的抽样,因此优化过程较长。遗传算法是一种以自然选择和遗传理论为基础, 将生物进化过程中适者生存规则与种群内部染色体的随机交换机制相结合的随机化搜索算法。第四相空间,时间平均,系统平均11、 Ergodic Hypothesis遍历性假设是一个分子系统的足够长时间的演化(保持能量守恒)可遍历(或无限接近)任何微观状态。(绝大多数情况下不成立)不是真实的,因为采样时间非常短。但在一些特殊性情况是真实的。12、 Metropolis approachmetropolis是一种采样方法,一般用于获取某些拥有某些比较复杂的概率分布的样本。采样最基本的是随机数的生成,一般是生成具有均匀分布的随机数。13、 General steps of a Monte Carlo simulation蒙特卡洛方法( Monte Carlo method) , 也称统计模拟方法, 是20世纪40年代中期由于科学技术的发展和电子计算机的发明, 而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。 是指使用随机数( 或更常见的伪随机数) 来解决很多计算问题的方法。MC方法的起源于布丰投针实验。针对待求问题, 根据物理现象本身的统计规律, 或人为构造一合适的依赖随机变量的概率模型, 使某些随机变量的统计量为待求问题的解, 进行大统计量( N) 的统计实验方法或计算机随机模拟方法。(大数定理,中心极限定理)(1)选取所要研究的系统并建立适当的模拟模型。(2)设定模拟区域的边界条件,选取粒子间作用势模型。(3)设定系统所有粒子的初始位置和初始速度。(4)计算粒子间的相互作用力和势能,以及各个粒子的位置和速度。(5)待体系达到平衡,统计获得体系的宏观特性。大数定理与中心极限定理与模拟退火的区别: 模拟退火:先升温,再降温,不关心过程 MC模拟:温度不变,关心过程,温度等于生理温度随机数,各种随机数随机数必备的两个特点:独立性和均匀性伪随机数的统计检验:均匀性,在【0,1】内等长度子区间中随机数的数量是一样的第五14、 the typical time step in a MD simulation时间步长是根据分子振动或转动频率来确定的,太长的时间步长会造成分子间的激烈碰撞,体系数据溢出;太短的时间步长会降低模拟过程搜索相空间的能力,因此一般选取的时间步长为体系各个自由度中最短运动周期的十分之一。设为分子中最小伸缩振动周期的十分之一,一般碳氢的伸缩振动周期最短,是10fs。所以速度限制在1fs。15、 why , choosing such a time step16、 The Leap-frog method蛙跳算法是一种全新的启发式群体进化算法,具有高效的计算性能和优良的全局搜索能力。作为一种新型的仿生物学智能优化算法,结合了基于模因进化的模因演算法和基于群体行为的粒子群算法。该算法具有概念简单,调整的参数少,计算速度快,全局搜索寻优能力强,易于实现的特点。蛙跳算法的思想是:在一片湿地中生活着一群青蛙。湿地内离散的分布着许多石头,青蛙通过寻找不同的石头进行跳跃去找到食物较多的地方。每只青蛙个体之间通过文化的交流实现信息的交换。每只青蛙都具有自己的文化。每只青蛙的文化被定义为问题的一个解。湿地的整个青蛙群体被分为不同的子群体,每个子群体有着自己的文化,执行局部搜索策略。在子群体中的每个个体有着自己的文化,并且影响着其他个体,也受其他个体的影响,并随着子群体的进化而进化。当子群体进化到一定阶段以后,各个子群体之间再进行思想的交流(全局信息交换)实现子群体间的混合运算,一直到所设置的条件满足为止。边界条件,真空边界条件,周期边界条件,截断半径的边界条件 17、 Box types in PBC立方体、十二面体、六方柱、截断正八面体,格子的选取必须足够大,考虑分子的旋转。正十二面体和截断正八面体用得比较多18、 why ,electrostatic interactions are problematic in MD长程力:随距离的增加而缓慢减少。如静电力。这种静电想回作用会消退的。19、 the most efficient algorithm to compute electrostatic interactions so farEwald 求和在k空间求和那一部分的级数会发散。通常为了避免这种问题,分子模拟的程序在处理非电中性系统的Ewald 求和是都会给系统加上一个均匀分布的背景电荷密度来中和这部分电荷。如果你的体系净电荷不大(比如说只有-2 e),那么这个背景电荷的影响是比较小的,反之,如果你的体系净电荷很大,那么Ewald 求和带来的误差就会很大。(使用快速傅里叶变换)20、 microcanonical, canonical, and isothermal-isobaric ensembles微正则系综(microcanonical ensemble):系综里的每个体系具有相同的能量(通常每个体系的粒子数和体积也是相同的)。正则系综 (canonical ensemble):系综里的每个体系都可以和其他体系交换能量(每个体系的粒子数和体积仍然是固定且相同的),但是系综里所有体系的能量总和是固定的。系综内各体系有相同的温度等温等压系综(isothermal-isobaric ensemble):正则系综的推广,体系间可交换能量和体积,但能量总和以及体积总和都是固定的。(系综内各体系有相同的粒子数。)正如它的名字,系综内各个体系有相同的温度和压强。21、 how, couple the system at constant temperature and pressure in MD一个明显的方式来改变系统的温度是调节速度比例。简单的速度扩展方法是通过因子控制。NVT系综就是通过控制体积(密度)来控制体系的压力。压力可以保持在一个常数值通过简单地伸缩体积,即改变模拟细胞的体积。模拟盒子的体积被因子缩放。22、 Particle decompositionPD是一种简单的并行算法类型。PD算法比较容易实现, 但是由于它需要各处理器不停交换粒子的位置信息, 通信开销相当大, 难以实现大规模MD模拟
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号