对于一些背景,我正在使用 MalImg 和 Microsoft BIG 数据集进行恶意软件分类项目。 问题是:
我尝试搜索谷歌并询问chatgpt,他们都没有帮助。 ChatGPT 建议本地化 CNN 和滑动窗口,但由于模型是通过像素操作的,我认为它们是不对的。
如果我正确理解你的问题,你正在谈论不同尺寸的图像,对吗?
如果是这种情况,您应该将尺寸标准化为相同尺寸。如果您使用 Python,则可以使用 OpenCV 和 Pillow:https://cloudinary.com/guides/bulk-image-resize/python-image-resize-with-pillow-and-opencv .
然后你必须对图像进行 z 缩放(也有替代方案),并且可以训练 CNN(我建议从简单的 ResNet 开始)。这不需要从头开始实施。请参阅:https://www.tensorflow.org/api_docs/python/tf/keras/applications/resnet