概念说明

KUPL提供了诸如D=A*B+C形式的矩阵编程MMA接口，便于发挥鲲鹏硬件Matrix computation能力加速矩阵乘计算。除此之外，矩阵编程还提供了copy接口，实现两种不同内存空间排布的矩阵之间快速转置的能力，从而解决使用MMA接口对于A/B矩阵特殊排布要求带来的易用性问题。相关概念如下：

Int，整数包装类型，用于传递编译期整型常量。
Ops，枚举包装类型，用于传递编译期枚举常量。

Shape，表示矩阵尺寸或计算尺寸。

Stride，表示矩阵元素行/列跨度。
Layout，表示矩阵内存布局。
Tensor，矩阵对象，包含源数据与布局。

使用此编程接口，需在支持Matrix computation指令的环境下安装HPCKit。

下述编程接口说明中的示例均为基于Bisheng版本KUPL矩阵编程接口实现；GCC版本受限于Matrix computation指令的支持，实现上存在差异。

父主题： 矩阵编程接口函数