如何在 python 中对 numpy 向量强制量化(降低位精度)?

问题描述 投票:0回答:0

我正在尝试研究如何降低 python 中 numpy 向量的精度或对数据而不是神经网络执行量化。 我的目标是在列表 (a) 中植入量化机制(减少位数),其中包含存储在 FP64 和 FP32 中的值数组。有什么办法可以降低数组中值的精度(比如 int8、fp16,甚至 2 位或 4 位),然后更快地执行计算?

重申一下,对于第一阶段,当值以 FP64 数据类型存储在列表 (a) 中时。当我尝试从列表 (a) 中检索数据以将其存储在新列表 (b) 中时,我需要将精度降低到较低的位以确保更快的计算。是否有任何方法可以动态地对整个计算具有不同的精度级别,即从默认的 fp64 执行 2 位、4 位、int8、fp16、bf16 的计算?

python numpy floating-point precision quantization
© www.soinside.com 2019 - 2024. All rights reserved.