返回顶部我要评分获取效率正确性完整性易理解0/200提交关闭在线提单论坛求助 矩阵计算介绍 仅在矩阵计算加速使能的情况下,支持向量的外积操作。以双精度浮点数为例,一个向量长度可容纳8个双精度浮点数,执行一次向量外积支持乘累加两个操作,同时单cycle支持一次向量外积的乘累加操作,因此每周期可执行128次浮点运算。对于不同数据精度,矩阵算力比值分别是FP64:FP32:FP16:int8=1:2:4:16。 父主题: 浮点计算加速