[我较早读过this文章,并注意到熊猫应用函数,迭代和for循环是使用熊猫数据帧的极其缓慢而有效的方式。
我正在对某些文本数据进行情感分析,但是使用Apply会导致高内存使用率和低速度,类似于this答案中所示。
%%time
data.merge(data.essay.apply(lambda s: pd.Series({'neg':sid.polarity_scores(s)['neg'],
'neu':sid.polarity_scores(s)['neu'],
'pos':sid.polarity_scores(s)['pos'],
'compound':sid.polarity_scores(s)['compound']})),
left_index=True, right_index=True)
如何使用内置的numpy或pandas函数实现此功能?编辑:-该列包含论文文本数据