NVIDIA GPU上的Tensor线性代数
cuTENSOR库是同类中第一个GPU加速的张量线性代数库,提供张量收缩,归约和逐元素运算。cuTENSOR用于加速在深度学习训练和推理,计算机视觉,量子化学和计算物理领域的应用。使用cuTENSOR,应用程序会自动受益于常规性能的改进和新的GPU架构。
cuTENSOR库针对NVIDIA GPU的性能进行了高度优化。最新版本增加了对DMMA和TF32的支持。
手机扫一扫
移动阅读更方便
你可能感兴趣的文章