开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

矩阵计算介绍

仅在矩阵计算加速使能的情况下,支持向量的外积操作。以双精度浮点数为例,一个向量长度可容纳8个双精度浮点数,执行一次向量外积支持乘累加两个操作,同时单cycle支持一次向量外积的乘累加操作,因此每周期可执行128次浮点运算。对于不同数据精度,矩阵算力比值分别是FP64:FP32:FP16:int8=1:2:4:16。