我想在 tensprflow /keras 中使用 GPU/cpu 估计神经网络的推理时间。是否有公式/代码可以让您了解神经网络的 FLOP、Cuda 核心/cpu 的数量和 cpu/GPU 的频率?训练时间是否存在类似的公式?
是否还有其他 cpu/GPU 特性对估计推理或训练时间很重要?
估计在具有 4000 个 CUDA 内核的 GPU 上运行推理比在只有 2000 个 CUDA 内核的 GPU 上运行推理快两倍是否合理?
看了这篇文章,解释的很好,但是不知道在tensorflow中怎么用?