机器学习集群或分类程序

问题描述 投票:0回答:1

我正在研究一种表示C / C ++程序代码的方法。为了创建数据集并在那之后做一些机器学习。

将代码视为文本并进行一些文本挖掘对我来说似乎不正确。因为我对计算的语义和精确性更感兴趣。

那么什么可以成为一个很好的代表性程序载体?

谢谢。

machine-learning code-analysis
1个回答
0
投票

我认为你不希望将你的程序表示为令牌序列。

请记住,您不必将代码实际表示为单词。如果您对语义关系感兴趣,可以使用更高级别的描述 - 例如,您可以使用表达式的解析树而不是令牌。

您还可以进一步采用这种语法方法,并将整个程序表示为某些语法中的解析树而不是一系列标记。有循环网络可以处理树形结构数据。

© www.soinside.com 2019 - 2024. All rights reserved.