网上找到的答案,供参考
现有的人工智能计算系统多采用异构架构。在节点间尺度上多为同构系统,在节点内尺度上有异构的形式。现代处理器是SISD、SIMD、MISD、MIMD的复合体,能实现复杂的并行计算,例如支持标量计算的CPU,支持向量、张量计算的GPU、TPU,支持空间计算等专用计算的FPGA和ASIC等。现有的人工智能硬件重点关注深度神经网络这类模型,支持适度低精度计算,对部分简单算子如矩阵乘、向量运算、卷积等张量计算进行加速。其实现方式多采用计算和存储分离的冯·诺伊曼架构,随着工艺的进步,互连功耗占比越来越大,甚至使数据移动功耗大于运算功耗,引起了更大的性能损失。