资源预览内容
第1页 / 共36页
第2页 / 共36页
第3页 / 共36页
第4页 / 共36页
第5页 / 共36页
第6页 / 共36页
第7页 / 共36页
第8页 / 共36页
第9页 / 共36页
第10页 / 共36页
亲,该文档总共36页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计算机科学与技术专业毕业论文计算机科学与技术专业毕业论文 精品论文精品论文 面向程序局部性的面向程序局部性的并行优化技术研究并行优化技术研究关键词:并行程序关键词:并行程序 优化设计优化设计 多核特性多核特性 局部性局部性 层次存储结构层次存储结构 重用关系重用关系摘要:现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的 出现以及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺 水平的进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的 速度,并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传 统的程序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性, 导致程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了 一套面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方 法。该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这 种重用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方 法的程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同 样利用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了 局部性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用 该套方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效 率。我们还给出了该套方法的编译实现框架,并进行了总结与展望。正文内容正文内容现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出 现以及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水 平的进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速 度,并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统 的程序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性, 导致程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了 一套面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方 法。该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这 种重用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方 法的程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同 样利用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了 局部性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用 该套方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效 率。我们还给出了该套方法的编译实现框架,并进行了总结与展望。 现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的 进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用该套 方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。 我们还给出了该套方法的编译实现框架,并进行了总结与展望。 现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的 进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用该套 方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。 我们还给出了该套方法的编译实现框架,并进行了总结与展望。现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的 进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用该套 方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。 我们还给出了该套方法的编译实现框架,并进行了总结与展望。 现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的 进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用该套 方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。 我们还给出了该套方法的编译实现框架,并进行了总结与展望。 现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的 进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用该套 方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。 我们还给出了该套方法的编译实现框架,并进行了总结与展望。 现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用该套 方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。 我们还给出了该套方法的编译实现框架,并进行了总结与展望。 现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的 进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层次存储结构中的“漂移”现象。 最后,我们通过实验证明,使用该套 方法对程序并行优化,可以显著降低程序的运行时间,提高程序的运行效率。 我们还给出了该套方法的编译实现框架,并进行了总结与展望。 现在的并行程序开发面临着两个十分重要的问题。首先,多核处理器的出现以 及逐渐普及,对并行程序设计开发提出了更高的要求。其次,随着工艺水平的 进步和处理器体系结果的发展,处理器的速度已经远远超过了存储器的速度, 并且这种速度上的差异在逐渐扩大,从而导致了“存储墙”的出现。传统的程 序并行化技术固然可以利用多核的特性,但其基本不考虑程序的局部性,导致 程序的运行性能较差。 本文针对循环嵌套结构中的一类程序,研究出了一套 面向程序局部性的并行优化方法。首先,本文提出了一种新的并行划分方法。 该划分方法考虑了同线程内不同访存之间(U-U)的重用关系,并尽量利用这种重 用关系来提高程序的局部性。而后,本文还提出了一种基于新并行划分方法的 程序优化方法。该优化方法考虑了线程间访存(T-T)的重用关系,并且也同样利 用这种重用关系进一步增强程序的局部性。此外,我们还在研究中发现了局部 性在层
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号