鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

特性范围

数据类型

支持的数据类型,其中src和dst的类型必须一致。

传播方向

src数据类型

dst数据类型

FWD_D、BWD_D

f32

f32

f16

f16

bf16

bf16

s32

s32

s8

s8

u8

u8

数据排布

支持1D至5D Tensor维度,具体数据排布如下,输入和输出的数据排布方式需保持一致。

Tensor维度

src数据排布

dst数据排布

1D Tensor

a

a

2D Tensor

ab、ba

ab、ba

3D Tensor

abc、acb、bac、bca、cab、cba

abc、acb、bac、bca、cab、cba

4D Tensor

abcd、abdc、acbd、acdb、adbc、adcb、bacd、bcda、cdab、cdba、dcab

abcd、abdc、acbd、acdb、adbc、adcb、bacd、bcda、cdab、cdba、dcab

5D Tensor

abcde、abced、abdec、acbde、acdeb、adecb、bacde、bcdea、cdeab、cdeba、decab

abcde、abced、abdec、acbde、acdeb、adecb、bacde、bcdea、cdeab、cdeba、decab

参数约束

字段

含义

取值范围

--dir

传播方向。

默认值:FWD_D

BWD_D

--dt

src和dst数据类型。

默认值:f32

f16

bf16

s32

s8

u8

--tag

src和dst数据内存排布。

a

ab

ba

abc

acb

bac

bca

cab

cba

abcd

abdc

acbd

acdb

adbc

adcb

bacd

bcda

cdab

cdba

dcab

abcde

abced

abdec

acbde

acdeb

adecb

bacde

bcdea

cdeab

cdeba

decab

--axis

轴心所在维度。

取值范围[0, Tensor维度-1]

--group

分组大小。

取值约束:大于等于1的整数,且要整除轴心所在维度的规模

[shuffle_desc]

src和dst规模。

N1xN2xN3…xN5