机器学习在恶意软件分类中的使用（CNN、RNN 和图像）

问题描述投票：0回答：1

对于一些背景，我正在使用 MalImg 和 Microsoft BIG 数据集进行恶意软件分类项目。问题是：

每个单独的像素都是模型的输入。
恶意软件直接一点一点转换成图像。
假设序列 (0110 1000 1001) 存在，并且如果相同的序列位于同一张或另一张图像中的不同位置 (10 1000 1001 - 1010 0010 01--)，则仅意味着位稍微未对齐与最后一个例子相比，看起来完全不同。
有什么办法可以克服这个问题吗？

我尝试搜索谷歌并询问chatgpt，他们都没有帮助。 ChatGPT 建议本地化 CNN 和滑动窗口，但由于模型是通过像素操作的，我认为它们是不对的。

machine-learning

conv-neural-network

recurrent-neural-network

image-classification

malware-detection

1个回答

0
投票

如果我正确理解你的问题，你正在谈论不同尺寸的图像，对吗？

如果是这种情况，您应该将尺寸标准化为相同尺寸。如果您使用 Python，则可以使用 OpenCV 和 Pillow：https://cloudinary.com/guides/bulk-image-resize/python-image-resize-with-pillow-and-opencv .

然后你必须对图像进行 z 缩放（也有替代方案），并且可以训练 CNN（我建议从简单的 ResNet 开始）。这不需要从头开始实施。请参阅：https://www.tensorflow.org/api_docs/python/tf/keras/applications/resnet