资源预览内容
第1页 / 共23页
第2页 / 共23页
第3页 / 共23页
第4页 / 共23页
第5页 / 共23页
第6页 / 共23页
第7页 / 共23页
第8页 / 共23页
第9页 / 共23页
第10页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
并行面向对象语言技术进展于勐2001年3月26日(一教讨论班)需求背景z并行计算的软件进展落后于并行计算机的硬件进展约一代(K. Hwang & Z. Xu)zHPF,并行编译器的成功应用z面向对象技术所获得的成功(Java, CORBA, DCOM, OOA, OOP)z高性能和易于使用的发展趋势z并行的面向对象语言?并行面向对象语言zMentat - University of VirginiazpC+ - portable paralle C+ IndianazCC+ - Concurrent C+ ISI of USCzHPC+ - High Performance C+ Consortium at Indiana UniversityzConcert (ICC+) - IllinoiszJavar - Indiana University并行模型z图模型yMacro Data flow Graph of MentatyMultiple Objects Multiple Data flowz线程模型ypC+ SPMD yHPC+ 异构计算节点,多上下文,多级并行性z对象交互规范JAVA RMI, Nexus RMI, CORBA, DCOM和OLE等并行面向对象语言的并行设施z并行程序块zMentat对象z处理器对象和全局对象指针z对象聚集z对象分布并行面向对象语言的并行设施z同步和互斥z隐式粒度控制z函数调用z全局名字空间并行程序块zCC+中的并行程序块用par statementsopt表示。zCC+中用parfor (for-init-statement expressionopt;expressionopt) statement标识一个并行循环。zICC+用conc关键字来标识并行程序块和并行循环。与CC+不同,ICC+中的并行块和并行循环中的迭代由编译器检查并保证语句间的依赖关系。并行程序块zHPC+采用和Javar相同的方式对循环进行并行化。程序员为需要并行化的循环标明#pragma HPC_INDEPENDENT,由编译器为该循环生成多个并行执行的线程副本,每个线程完成部分循环计算。在循环中,程序员还可以用#pragma HPC_REDUCE指出归约变量,用#pragma HPC_INDEPENDENT,PRIVATE指出可私有化的变量。Mentat对象zmentat关键字定义的Mentat对象占据独立的,互不相交的存储空间。其成员函数调用都是传值调用,函数返回结果也是传值的。zpersistent mentat对象会保持对象调用间的状态,regular mentat对象则不保持对象调用间的状态,其成员函数更像一个纯函数。z对象在使用时实例化。处理器对象和全局对象指针zCC+在类说明中用global来说明一个处理器对象(Processor Object)类。处理器对象的公共成员函数和成员数据的作用域为对象所在的处理器。zpC+中的处理器对象的概念与上述不同,而与HPF中的处理器模板相似。pC+中用类似Processor P(m,n)的语法说明处理器结构,实际上对应于目标SPMD程序的线程结构。对象聚集z对象聚集(aggregate)指的是需要并行执行相同操作的一组对象。我们认为对象聚集是用于高性能计算的并行面向对象语言的一个必备的语言设施。zpC+用Collection关键字采用和类相同的语法定义对象聚集。对象聚集zCollection被 编 译 器 自 动 处 理 为 模 板(Template)。 程 序 员 还 可 以 用 定 义Template TEClass的方法定义Collection,并可以用下面引用子向量的形式使用Collection。zpi:j:k.f();z表示对Collection p中标识从i到j,步长k的所有元素调用函数f()。对象分布下面的例子建立了一个复数元素的分布数组,数组元素在处理器的分布由分布对象myDist和对齐对象myAlign共同确定。Processors P;Distribution myDist(7,7,&P,CYCLIC,WHOLE);Align myAlign(5,5,ALIGN(dummyij,myDistij);DistributedMatrix A(&myDist, &myAlign);因为C+中已经有Template关键字,所以pC+采用Distribution作为描述数据模板的关键字,以免混淆。模板和对齐的定义与HPF相同。同步和互斥z单赋值同步变量。z计数信号量。z协同操作和通信。z对象级同步。z函数级同步。z语句块的同步。隐式粒度控制zICC+中的粒度是由编译器来动态分析控制的。ICC+编译器在编译时刻生成多个可执行的并行线程版本,由于线程的开销也不相同(在ICC+中堆线程有1种,栈线程有3种),编译器生成的目标代码在运行时刻根据当时的动态绑定,对象分布情况选择具有最小执行开销的线程版本运行。函数调用zMentat中对函数返回值采用了return-to-future机制,其函数名为rtf()。y.它可以返回另外的刚刚启动或正在运行的Mentat对象的函数值。y.rtf()不表明函数运行结束,只表示结果已经可用。函数可以继续进行其它处理,例如保存计算状态,和其它对象通信等。y依据编译器发现的依赖关系,rtf()返回值送给MDF中所有使用该值的后继结点。函数调用zHPC+中不同上下文之间的函数调用需要上下文标识和全局函数。需要远程引用的函数要先进行登记,使用者首先获取登记标识,在使用远程上下文标识和函数标识进行调用。调用者随即获得控制权继续执行,返回值用单赋值同步变量保存,仅当调用者读该变量并且返回结果尚未返回时调用者阻塞。全局名字空间z全局对象名字空间是指在系统中的对象都有唯一的标识,以便用该标识进行对象间的操作。全局对象名字空间允许数据一致的存取,并将数据和任务的位置分配和函数说明分离开。优化技术z内嵌(inlining)z访问区域扩张(access region expansion)z局部性优化y动态指针对齐(dynamic pointer alignment)y视图缓冲(view caching)运行时支持zMDF虚拟机z自动存储管理zNexusRMI或CORBA IDL几种并行面向对象语言的比较目前的问题什么样的并行设施是必需的,编译器和程序员所分担的并行性的描述和实现进行怎样的折衷。针对分布式对象计算环境的目标程序的优化技术的开发。用于高性能计算的通用和专用并行类库的构造。同时提供对UMA和NUMA的支持总结z易于使用的并行性都是这些研究的主要目标之一。z并行化的语言主要集中于C+和Java两种语言。这是因为这两种语言具有比较广泛的应用基础。在将这两种语言和基于这两种语言所做的并行扩展应用于科学计算方面也获得了许多成果。z采用面向对象技术的并行计算是高性能计算发展的必然趋势之一。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号