我正在从事一个简单的激情项目,涉及研究论文的图形分析。 基本上,我想创建一个连接研究论文的图形结构,并最终想分析信息如何流经节点,类似于“连接的论文”,但由于我是图形分析的新手,我想得到你的建议如何继续前进。
在处理研究论文时,假设我们的信息很少,如下:
{
'paperId':
'title':
'year published':
'abstract':
'authors':
'keywords';
...
}
我有几个来自“id”的节点具有上面列出的属性。 未连接节点的示例:
所以,我的问题是:
在进行任何分析之前制定构建网络数据结构的策略非常有帮助。我想请专家帮助我完成这个业余项目。 我目前正在使用 Python Networkx。
非常感谢!
如何根据属性连接这些节点?
根据您列出的属性,我不会连接任何顶点。
如果一篇文章的作者也出现在另一个节点中,则这两个节点应该连接。我们应该如何表示?
为每个作者创建一个顶点。将作者的边添加到所创作的每个纸张顶点。
作者有自己的节点,
是的。
日期、机构、关键词等也类似..
没有。
在工具方面我还应该考虑什么?
恕我直言,您不想使用图表来存储此信息。关系数据库会更适合您的数据。