如何在Azure Databricks笔记本中调试长时间运行的python命令？

Question

我正在学习本教程：https://docs.microsoft.com/en-us/academic-services/graph/tutorial-azure-databricks-hindex

我已经完全访问了Microsoft Academic Graph数据集，并希望根据该数据集发布一些基本的pySpark代码。

例如，此代码：

# Get affiliations
Affiliations = MAG.getDataframe('Affiliations')
Affiliations = Affiliations.select(Affiliations.AffiliationId, Affiliations.DisplayName)
Affiliations.show(3)

[当我使用'Shift + Enter'运行代码时，它进入'运行命令'的状态-甚至在半小时后也似乎从未完成。我已为此插入了屏幕截图，并附加到我的帖子中。

我分别运行了这些命令，这是导致运行缓慢的最后一个（Affiliations.show(3)）。

例如，当我自己运行命令（Affiliations = MAG.getDataframe('Affiliations')）时，实际上得到的结果是：

AffiliationId:long
Rank:integer
NormalizedName:string
DisplayName:string
GridId:string
OfficialPage:string
WikiPage:string
PaperCount:long
CitationCount:long
Latitude:float
Longitude:float
CreatedDate:date

问题：如何调试它以找出导致速度慢的原因？