大数吃小数

  1. 将浮点分布全部设为整数 1,以验证累加次数与累加逻辑是否正确,排查确定性问题。

精度比较

  1. float16bfloat16 场景下,对比 NPU 与 GPU 的精度表现;若二者相对 CPU 均存在偏差,可将相关计算切换为 float32,或固定 CPU 为 float32、NPU/GPU 为 float16,再比较 diff(CPU, NPU)diff(CPU, GPU),若 diff(CPU, NPU) < diff(CPU, GPU),则可判定 NPU 精度达标。