RMSNorm
接口功能
LayerNorm的轻量变体,仅使用均方根值归一化(无均值中心化)。
函数原型
class RMSNorm(torch.nn.Module):
def __init__(self, dim: int, eps: float = 1e-6):
super().__init__()
self.eps = eps
self.weight = torch.nn.Parameter(torch.ones(dim))
def forward(self, x: torch.Tensor):
# 计算均方根值
rms = x.norm(2, dim=-1, keepdim=True) * (x.size(-1) ** -0.5)
return x / (rms + self.eps) * self.weight
参数说明
参数 |
类型 |
必填 |
说明 |
|---|---|---|---|
dim |
int |
是 |
输入特征维度。 |
eps |
float |
否 |
数值稳定性常数(默认1e-6)。 |
weight |
tensor |
否 |
可学习的缩放因子(自动创建)。 |
父主题: 算子接口