如何在weka中添加恶意功能以将其分类为数据集

问题描述 投票:0回答:2

我正在做一个有关如何使用weka数据挖掘工具检测和分类恶意内容的项目。我已经开发了一种算法,但是问题是我不知道如何以及在何处添加javascript,html或URl的恶意功能。

例如:如果存在(///)三斜杠,则将其分类为恶意URL。同样,我还有其他功能可以对算法执行分类。

因此,如果有人知道该怎么做,请回复我。

提前感谢。

java classification weka webcontent
2个回答
1
投票

此问题更多地与项目的特征提取或查找领域特征有关。通常,weka可以使用现成的功能。因此,您的问题与weka有关如何为项目查找和使用功能有关。

我不能帮助html和javascript,但是对于URL分类,以下文章可能会有所帮助。

Kan M-Y和Thi HON(2005),“使用URL功能进行快速网页分类”,在第14届ACM信息和知识管理国际会议论文集中。美国纽约,纽约,第325-326页。 ACM。

Ma J,Saul LK,Savage S和Voelker GM(2009),“超越黑名单:学习从可疑URL中检测恶意网站”,在第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集中。美国纽约,纽约,第1245-1254页。 ACM。


0
投票

我们创建了变态恶意软件的Windows API调用序列。在我们的研究中,我们将每种软件产生的系列转换为8个主要的恶意软件系列:特洛伊木马,后门,下载器,蠕虫,间谍软件广告软件,Dropper,病毒。https://github.com/ocatak/malware_api_class

© www.soinside.com 2019 - 2024. All rights reserved.