资源预览内容
第1页 / 共18页
第2页 / 共18页
第3页 / 共18页
第4页 / 共18页
第5页 / 共18页
第6页 / 共18页
第7页 / 共18页
第8页 / 共18页
第9页 / 共18页
第10页 / 共18页
亲,该文档总共18页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
GPU计算解决方案 - 成功案例 NVIDIA Tesla解决方案帮助我们更快、更准确地解决了多个行业中世界上最重要的计算难题。CAD/CAM/CAE计算金融计算流体动力学學地理信息服务成像生命科学學石油天然气NVIDIA Tesla解决方案帮助我们更快、更准确地解决了多个行业中世界上最重要的计算难题。挑战虚拟时装表演能否成为未来的潮流? 这一问题尚不确定,但以色列佩塔提克瓦的OptiTex Ltd.公司已经利用其3D计算机辅助设计/计算机辅助制造(CAD/CAM)设计技术将整个设计业带入了全新境界。传统上,设计师必须真正创造出实际衣物线条的织物样品来进行原型制作以及为潜在投资者提供展示。这是一个相当耗时且代价高昂的过程,会产生很大的浪费。 OptiTex 3D实现了这一过程的现代化。该软件通过让设计师在虚拟模特身上模拟衣物设计的外观和运动,从而让他们在剪裁第一块布料之前就能够审视、优化以及衡量这些样品。解决方案为解决这一设计难题,OptiTex利用NVIDIA CUDA软件开发环境来重新构建其衣物模拟引擎的数据与算法以使其能够在GPU上运行。 GPU计算解决方案让开发人员能够消除CPU环境下的瓶颈,最高实现10倍的性能提升。 季节性系列产品的开发时间一般为190天。但是使用了重新构建的OptiTex 3D解决方案之后,上市时间被缩短为短短的35天。OptiTex, Ltd.公司总裁兼首席执行官Ran Machtinger表示:“OptiTex 3D向GPU平台的转变大大提升了我们产品的效率,进一步为我们的客户提供了巨大效益。 有了实时能力,制版过程将彻底改变。 纺织业客户将不必依赖用户体验以及详尽的测试来确定最终版型,因为人们始终可以在3D模式下查看这些服装。影响由于GPU计算解决方案带来了实时性能,因此设计师能够降低生产成本并缩短设计周期时间。 服装、汽车、航空等各行各业的用户实际上无需浪费布料、纸张、用电、工时以及快递费用,从而节约了材料、电力、以及制造费用。NVIDIA(英伟达)Tesla解决方案可帮助更快、更精确地解决世界上计算金融行业最重要的计算难题。SciComp公司利用该解决方案计算衍生产品模型挑战金融衍生产品市场是一个高风险行业,在合同评估中,即使是最微小的错误也能够酿成巨额损失。因此,交易者必须仰仗复杂的数学模型来实现对合同价值与风险的敏感度。金融市场的快节奏性要求衍生产品的评估必须做到快速而准确。蒙特卡洛模型是一种应用最广泛的方法,该模型可以模拟潜在合同变量的数百万种情形,这些变量包括股票行市、物价、利率等等。这种模型虽然具有以上优点,但是却需要耗费特别长的计算时间。衍生产品合同的复杂程度、针对快速模型开发与快速准确评估方面的需求凸显了衍生产品市场所面临的一些挑战。SciComp公司出品的SciFinance等复杂软件包可提供有效的方法来解决这些难题。解决方案SciFinance是一款衍生产品模型开发环境,它可以从简明的高级模型技术规范中自动生成串行C语言/C+源代码。现在,为了大幅提升蒙特卡洛定价与风险模型的执行速度,SciComp公司在软件中加入了一大特性,使其能够自动生成支持NVIDIA(英伟达)CUDA的源代码。这一全新代码形式让关键的定价代码部分能够利用NVIDIA(英伟达)GPU(图形处理器)的高度并行架构。想要触发这种全新的代码形式,用户只需在模型技术规范中加入关键字“CUDA”即可生成支持CUDA、可编译的并行代码。这样做的结果是,当使用一颗NVIDIA(英伟达)Tesla C1060 GPU时,速度可从30倍提升至100倍以上。如果增加GPU的数量,性能则会进一步直线上升。SciComp公司执行副总裁CurtRandall表示:“用户凭借CUDA与GPU所能实现的速度提升是相当惊人的。凭借在GPU上的并行处理,外来合同大型投资组合的定价只需短短几分钟即可完成而非从前的数小时之久。由于金融机构能够在NVIDIA(英伟达)解决方案上轻松地运行我们的软件,因此采用该解决方案是这些金融机构的不二选择。”影响更快地创建和执行蒙特卡洛定价模型的能力让交易者与风险经理能够评估其它模型情形并加强风险分析。更好地理解衍生产品合同及其风险敏感度则会提高交易的利润潜力。NVIDIA Tesla解决方案帮助我们更快、更准确地解决了世界计算流体动力学行业中最重要的计算难题。美国国家大气研究中心BAE Systems:使用MATLAB实现地理定位加速GPU计算复杂多相流动分子动力学模拟挑战从致命的飓风到全球气候变化,天气是影响我们日常生活最大的不可控制因素,有时甚至会决定我们是生死还是存亡。然而,现在天气情况的早期预测变得更快、更精确,这样就为人们提供了更长的准备时间。在美国国家大气研究中心(NCAR),一支科学家队伍已经开发出即时、长期以及短期天气条件的复杂的预报模型。气象研究与预报模型(WRF)是世界上应用最广泛的模型,其用户包括美国国家气象局、空军气象局、国外气象局以及商业性天气预报公司等。美国国家大气研究中心气候与气象模型正从Tera级(1万亿FLOPS)向Peta级应用程序转变,其发展速度比传统计算群集的更快,而添加更多CPU已经无法有效提升速度。这种问题在应用程序包含实时组件或其它在时间上有要求的解决方案时尤为突出。解决方案在提升总体预报速度与精确性方法的调查过程中,美国国家大气研究中心的技术人员与科罗拉多大学波尔德分校的研究人员展开合作,转向NVIDIA GPU计算解决方案。在移植到NVIDIA CUDA之后,微观物理学速度提升了10倍。微观物理学是至关重要、但又非常耗费计算资源的气象研究与预报模型部件。虽然微观物理学由不到百分之一的模型源代码构成,但是将其转化为CUDA还是实现了整个模型20%的速度提升。气象研究与预报模型主要软件开发人员、美国国家大气研究中心的John Michalakes表示:“当我们在传统群集上为高时效性预报而用尽全部系统动力时,这一结果的及时到来相当鼓舞人心。由于我们能够把NVIDIA的GPU计算技术整合到更多的气象研究与预报模型中,因此我们的目标是将预报时间至少缩短两倍。我认为加速器的作用将彻底改变气象与气候的建模。”影响现在美国国家大气研究中心以及全世界依赖气象研究与预报模型的多家机构均能够更快地发布人们迫切需要的实时天气事件预报以及发展动态。结果,人们将能够为这些天气事件早做准备并预防损失。GPU计算复杂多相流动分子动力学模拟挑战分子动力学(molecular dynamics,MD)模拟是随着计算机技术的发展而兴起的一种科学计算方法,现已应用到广泛的领域中,如医药、材料、能源、机电等。随着纳米、微机电和微化工等技术的兴起,纳微流动的MD模拟近年来也成为热点。传统连续流体力学难以处理和解释这些尺度上的独特性质与现象,而流动归根结底是流体分子的集体行为,MD模拟能详细跟踪每个分子的运动,并通过分析速度、温度等统计性质阐释理论中的难点、发现新的机理,故日益受到重视。但计算能力一直是制约此研究发展的瓶颈。现在这方面很多成熟算法都基于传统体系结构的中央处理器(CPU),但其发展已显颓势。图形处理器(GPU)的计算能力现已远高于CPU一到两个量级。如何在MD流动模拟中利用GPU的强大能力已成为一个重要的现实课题。解决方案中国科学院过程工程研究所多相复杂系统国家重点实验室进行了图形处理器(GPU)上的分子动力学(MD)模拟。即利用配备了一片NVIDIA Tesla C870的服务系统来运行NVIDIA CUDA架构, 通过方腔流及颗粒-气泡接触等实例初步展示了此方式从微观上模拟介观行为的能力。经证实,在NVIDIA公司技术助力下,该计算过程速度是以往运用单核CPU计算的20到60倍,最高可达150 Gflops。传统GPU对非图形应用支持有限,只能通过图形API编程,内存带宽较低且访问限制多,从而制约了其性能发挥。NVIDIA CUDA的发布打破了传统GPU的性能瓶颈,提供了新的软硬件架构。本次模拟的多相体系中,CUDA把GPU直接视作数据并行计算设备而不再将计算映射到图形操作上,以扩展性较好的区域分解和常用的消息传递接口(Message Passing Interface, MPI)协议实现各节点间GPU的并行计算,以类C语言的方式给开发者更大自由来实现GPU算法。CUDA还能结合OpenMP,MPI和PVM等其他并行方式在节点内和节点间继续扩展计算能力,更好的发挥了GPU的强大性能,并将计算中的数据访问效率提高了一个量级以上。Tesla C870的有效计算性能(指计算分子对相互作用时的浮点操作数)是以往所采用的单核CPU的2030倍。若考察极端情况,即只测试耗时最长的分子间作用力计算,GPU更占优势, 约能发挥150 Gflops,占其可利用计算峰值(346 Gflops)的40%多,而CPU能发挥2.4 Gflops,GPU的计算能力达到CPU的60倍之多!说明GPU很适合像多体问题。影响方腔流是流体动力学的一个经典问题,本次模拟将GPU应用于方腔流的MD模拟,使得模拟体系的规模有较大提高,在一定程度上达到了(亚)微米尺度,沟通了连续的流体力学和离散的分子动力学。而多相纳微流动研究对纳米、材料、生物、微机电与微化工系统等技术领域更有实用性,但也更有挑战性,目前还没有成熟的理论方法,其MD模拟需要更多的计算资源且实现更加复杂,因此GPU的应用显得更有价值。另一方面, 利用CUDA技术和MPI协议,MD模拟可以实现某些物理实验难以进行的极端情况,这是MD模拟非常值得关注的新方式。总体来说,GPU在MD模拟上的应用还有巨大的潜力。如需进一步了解,请参阅科学出版社于2009年出版的基于GPU的多尺度离散模拟并行计算一书。挑战地理信息服务(GIS)技术对安全以及我们日常生活质量有着重大的影响。城市规划者以及规划公司使用地理信息服务应用程序来将物理地图信息与人口统计资料结合起来,这些资料包括人口数量、街道布局以及本地资源。从追踪911电话、研究二氧化碳浓度到监控杀虫剂的应用,这类应用程序应用越来越多。由于用户需求不断超越地理信息服务应用程序的范围,因此数据集变得越来越复杂,常常需要处理显示向量层、表面层以及图像的数G级字节的互动地图。Manifold.net是一家领先的地理信息服务系统开发商。在市场的迫切需求下,Manifold.net必须开发出能够高效、绝对准确地处理最大数据集的产品。对于这些如此先进的项目以及预计会越来越多的功能需求,该公司意识到基于CPU的计算解决方案已无法满足用户的需求了。解决方案Manifold于是就将其软件转到NVIDIA CUDA平台下,让用户能够享受到GPU的并行处理能力以及由PCI Express高带宽支持的数据互动。凭借CUDA配置,从前需要20分钟才能完成的运算现在30秒内即可完成。而且,从前需要30秒到40秒的运算现在达到了实时运算。Manifold.net产品部经理Dimitri Rotow表示:“说NVIDIA CUDA技术是计算机科学界自微处理器问世以来最具革命性的发明一点都不为过。该技术速度快、价格低并且具有很大的潜力。NVIDIA CUDA太重要了,因此所有Manifold的用户都应坚持采购支持CUDA的计算机硬件。”影响凭借其全新的CUDA加速,Manifold正在帮助开采之前无法开采的燃料矿藏、追踪空气中污染物的情况以及为警察和火
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号