大数吃小数
- 将浮点分布全部设为整数
1,以验证累加次数与累加逻辑是否正确,排查确定性问题。
精度比较
- 在
float16、bfloat16场景下,对比 NPU 与 GPU 的精度表现;若二者相对 CPU 均存在偏差,可将相关计算切换为float32,或固定 CPU 为float32、NPU/GPU 为float16,再比较diff(CPU, NPU)与diff(CPU, GPU),若diff(CPU, NPU) < diff(CPU, GPU),则可判定 NPU 精度达标。