现代GPGPU 架构汇总
阅读原文时间:2023年07月10日阅读:1

本篇是GPGPU 架构汇总的总章,参考的是AMD公布OpenCL 手册,该手册总结了AMD. Nvdia 早年的GPGPU体系架构,以及Opencl 各个API 与硬件结构的映射关系。本篇除了整理这两家的GPU 架构,也会增加Intel dGPU的架构(牙膏厂终于回过神了。。。。)

对于现代的 GPU,通常的它的控制逻辑单元比较简单(和 cpu 相比), cache 也比较小 。

线程切换开销比较小,都是轻量级的线程

GPU 的每个“核”有大量的 ALU 以及很小的用户可管理的 cache。

内存总线都是基于带宽优化的。 150GB/s 的带宽可以使得大量 ALU 同时进行内存操作 。

*  AMD GPU 硬件架构

*  Nvdia GPU Femi 架构

*  Intel  GPU Gen11 架构

手机扫一扫

移动阅读更方便

阿里云服务器
腾讯云服务器
七牛云服务器