NAG 多核算法库第 22 版性能测试

在计算性能与扩展性方面,NAG 的 多核算法库提供相同的函数功能,且又完全不会影响其计算结果的精确性。NAG 多核算法库主要就是让开发人员与编程员能够利用对称多重处理器 (SMP) 系统的特点。

由于我们进行严格的测试与质量保证的流程,多核算法库搭配供货商的算法库,能够在每个系统中有最佳的运行效能、函数功能与精确度。 英国利物浦大学采用 NAG 的 多核算法库与并行算法库后很满意如此显著的性能与速度提升,他们在各种科学、医学与工程学科中采用 NAG 算法库进行研究。

NAG 多核算法库提供各种的多核系统版本。也用来填补供货商提供的数学算法库不足的地方。 我们除了提供一个更为全面完整的数值函数外,我们也对 LAPACK 函数进行的优化的设计,也超越的一般数学库所提供的运行效能。 我们在下文中演示了一些例子。每个算法、问题矩阵的大小都会直接反应在效能表现上。

图一:实数正定矩阵的 Cholesky 分解 (DPOTRF)

SMP Benchmark 图一

图一中显示在 Sun UltraSPARC-III 多处理器系统上,多核算法库的效能提升。

图二:实数对称三角矩阵的特征值和特征向量问题,采用隐含 QLQR 方法 (DSTEQR)

SMP Benchmark 图二

在 NAG 多核算法库中的 QR 算法求解对称特征值问题已经做了全面的修改,以改善串行性能与充分利用并行方法求解问题。 如图二所显示的大规模矩阵问题,采用 NAG 的 多核算法库在 IBM POWER5 系统上运行,在 4 个处理器上的运行效能远远比标准 LAPACK 函数要快上九倍。

Figure 3: 一般实数矩阵的双对角矩阵简化 SVD 求解 (DBDSQR)

SMP Benchmark 图三

QR 算法求解奇异值问题在我们的多核算法库中已经做了近一步的提升。性能的提升也更为显著。如图三所显示的大型矩阵中,在 IBM POWER5 的环境上使用 NAG 多核算法库,在 4 个处理器的运行下,速度较标准 LAPACK 函数要快上 89 倍。