我在应用领域有一个普遍的问题。数据包含一个带有小样本的高维特征空间。一个稀疏网络,其节点具有不同的特征。网络有边缘。边缘越大,相关性越高或者依赖这对特征。一般来说我如何在我的模型中使用网络信息?
目前我在文献中搜索。我发现一般方法包括:1。网络嵌入。利用网络信息获取特征的嵌入。 2.graph神经网络。像GCN(图卷积神经网络)或GAT(图注意神经网络)或其他消息传递神经网络。
问题是,数据科学家可以试用的一般方法是什么,以利用有关功能的网络信息?网络不是在不同的样本上,只是在功能上。
我想到的第一件事是使用网络检查功能关联,并在训练之前删除高度相关的功能。