使用bertopic时如何解决这个浮动错误

问题描述 投票:0回答:1

运行 1 行代码时出现

sequence item 18: expected str instance, float found
错误。 2列的数据源一致性。第 1 列是 1 到 600 的通用 ID。第二列包含文本响应。这些文本响应可能包含浮动。有没有办法在运行主题之前编码或修复该问题,
probability = model.fit_transform(Docs)
?我是 python 新手,正在遵循指南。该指南最初是针对某种 Twitter 数据的,但我想我会尝试另一组数据,但没想到会遇到浮动错误。任何建议都会非常感激并帮助我成长。

pip install bertopic
visualization
import pandas as pd
import numpy as np
from bertopic import BERTopic
df = pd.read_csv("/Users/CENSORED/Desktop/CENSORED/CENSORED", engine = 'python', encoding = 'ISO-8859-1')
df = df [0:600]
model = BERTopic(verbose=True)
docs = df.text.to_list()
topics, probabilities = model.fit_transform(docs)
TypeError: sequence item 18: expected str instance, float found
python pandas bert-language-model deb
1个回答
0
投票

您的文档中存在空值。
它被读作

NaN
,即浮点数。

你可以绕过它,将其强制为字符串

df['text'].astype('str')

但是您应该考虑删除这些记录是否更好。

© www.soinside.com 2019 - 2024. All rights reserved.