获取Pandas系列字符串的第一个元素

Question

我想我有一个相对简单的问题，但我无法找到解决编码问题的合适答案。

我有一个pandas列的字符串：df1['tweet'].head(1) 0 besides food, Name: tweet

我需要提取文本并将其推送到这种格式的Python str对象：

test_messages = ["line1", "line2", "etc"]

目标是对一组推文进行分类，因此相信输入：X_test = tfidf.transform(test_messages)是一个str对象。

Answer 1

2
投票

使用list将Series（列）转换为python列表：

list(df1["tweet"])

Answer 2

获取系列head()，然后访问第一个值： df1['tweet'].head(1).item()
或：使用Series tolist()方法，然后切片第0个元素： df.height.tolist() [94, 170] df.height.tolist()[0] 94

（请注意，Python索引是基于0的，但head()是基于1的）