机器学习在恶意软件分类中的使用(CNN、RNN 和图像)

问题描述 投票:0回答:1

对于一些背景,我正在使用 MalImg 和 Microsoft BIG 数据集进行恶意软件分类项目。 问题是:

  • 每个单独的像素都是模型的输入。
  • 恶意软件直接一点一点转换成图像。
  • 假设序列 (0110 1000 1001) 存在,并且如果相同的序列位于同一张或另一张图像中的不同位置 (10 1000 1001 - 1010 0010 01--),则仅意味着位稍微未对齐与最后一个例子相比,看起来完全不同。
  • 有什么办法可以克服这个问题吗?

我尝试搜索谷歌并询问chatgpt,他们都没有帮助。 ChatGPT 建议本地化 CNN 和滑动窗口,但由于模型是通过像素操作的,我认为它们是不对的。

machine-learning conv-neural-network recurrent-neural-network image-classification malware-detection
1个回答
0
投票

如果我正确理解你的问题,你正在谈论不同尺寸的图像,对吗?

如果是这种情况,您应该将尺寸标准化为相同尺寸。如果您使用 Python,则可以使用 OpenCV 和 Pillow:https://cloudinary.com/guides/bulk-image-resize/python-image-resize-with-pillow-and-opencv .

然后你必须对图像进行 z 缩放(也有替代方案),并且可以训练 CNN(我建议从简单的 ResNet 开始)。这不需要从头开始实施。请参阅:https://www.tensorflow.org/api_docs/python/tf/keras/applications/resnet

© www.soinside.com 2019 - 2024. All rights reserved.