ASTRA-sim 2.0 是一款专注于现代深度学习系统挑战研究的分布式机器学习系统模拟器。它通过模拟分层网络结构,支持大规模分布式训练,旨在探索瓶颈问题并开发大型DNN模型的高效方法论。该项目提供了分层网络和分解系统建模,为研究人员提供了一个强大的平台来研究分布式机器学习系统的性能瓶颈,并开发高效的大规模深度学习训练方法。