如何在 python 中对 numpy 向量强制量化（降低位精度）？

问题描述投票：0回答：0

我正在尝试研究如何降低 python 中 numpy 向量的精度或对数据而不是神经网络执行量化。我的目标是在列表 (a) 中植入量化机制（减少位数），其中包含存储在 FP64 和 FP32 中的值数组。有什么办法可以降低数组中值的精度（比如 int8、fp16，甚至 2 位或 4 位），然后更快地执行计算？

重申一下，对于第一阶段，当值以 FP64 数据类型存储在列表 (a) 中时。当我尝试从列表 (a) 中检索数据以将其存储在新列表 (b) 中时，我需要将精度降低到较低的位以确保更快的计算。是否有任何方法可以动态地对整个计算具有不同的精度级别，即从默认的 fp64 执行 2 位、4 位、int8、fp16、bf16 的计算？