Learn more about...
NAG GPU 数值算法库
性能测试报告
为了验证结果的正确性,我们使用单线程的 CPU 执行。CPU 的函数并未优化,并不能据此作性能的比较。为了进行性能比较,我们采用已经高度优化的 MKL 函数, 它能透过 OpenMP 在多核的环境中执行。下图的测试结果是我们在以下的环境中执行而得:
CPU: Intel Core i7 860 running at 2.8GHz
RAM: 8GB
GPU: NVIDIA C2050
OS: Windows 7 64 bit
图中粗体部分为双倍精确度
测试与验证
我们参照 CPU 的串行结果,对于均匀分布的随机数生成器,我们在 CPU 与 GPU 上取得相同的结果。其他非均匀分布 (常态),我们认为在 CPU 与 GPU 的单精度表现上会有些微的差异, 因为 CPU 在储存计算过程中的结果时,通常会执行更高精度的计算。
志谢
我们要感谢 Technology Strategy Board (技术战略委员会) 与 Smith Institute (史密斯研究所) 的支持,以及英国工程暨物理研究委员会赞助 Giles 教授的学术研究。