Using accurate arithmetics to improve numerical reproducibility and stability in parallel applications

Yun He; Chris H.Q. Ding

Conference ProceedingsOPEN ACCESS

Using accurate arithmetics to improve numerical reproducibility and stability in parallel applications

Proceedings of the International Conference on Supercomputing (2000) 225-234

DOI: 10.1145/335231.335253

16Citations

11Readers

Abstract

Numerical reproducibility and stability of large scale scientific simulations, especially climate modeling, on distributed memory parallel computers are becoming critical issues. In particular, global summation of distributed arrays is most susceptible to rounding errors, and their propagation and accumulation cause uncertainty in final simulation results. We analyzed several accurate summation methods and found that two methods are particularly effective to improve (ensure) reproducibility and stability: Kahan's self-compensated summation and Bailey's double-double precision summation. We provide an MPI operator MPI_SUMDD to work with MPI collective operations to ensure a scalable implementation on large number of processors. The final methods are particularly simple to adopt in practical codes.

Cite

CITATION STYLE

APA

He, Y., & Ding, C. H. Q. (2000). Using accurate arithmetics to improve numerical reproducibility and stability in parallel applications. In Proceedings of the International Conference on Supercomputing (pp. 225–234). ACM. https://doi.org/10.1145/335231.335253

Using accurate arithmetics to improve numerical reproducibility and stability in parallel applications

Abstract

Cite

Register to see more suggestions