我想我有一个相对简单的问题,但我无法找到解决编码问题的合适答案。
我有一个pandas列的字符串:df1['tweet'].head(1)
0 besides food,
Name: tweet
我需要提取文本并将其推送到这种格式的Python str对象:
test_messages = ["line1",
"line2",
"etc"]
目标是对一组推文进行分类,因此相信输入:X_test = tfidf.transform(test_messages)
是一个str对象。
使用list
将Series(列)转换为python列表:
list(df1["tweet"])
head()
,然后访问第一个值:
df1['tweet'].head(1).item()
tolist()
方法,然后切片第0个元素:
df.height.tolist()
[94, 170]
df.height.tolist()[0]
94
(请注意,Python索引是基于0的,但head()
是基于1的)