在数据工程任务上花费了大量时间后,我正在寻找 RAG 工具或支持 CSV 文件的类似技术。我的项目涉及从 10 多年的 CSV 格式医院数据中提取特定条件的信息。我发现的大多数工具都适用于 PDF。有谁知道有什么工具可以简化大型 CSV 数据集的此过程吗?
我计划先准备 CSV,然后使用 RAG 提取一些有关某些特定条件的数据。然后我将再次将 RAG 的输出重新组织为 CSV。 (我也不确定这是否是一个好主意,所以如果我错了请纠正我)
我已经尝试过 Hugging Face 的 RAG,但它似乎只能在 PDF 上工作(如果我错了,请纠正我)。谁能建议一些适用于 CSV 文件的 RAG,这样我就可以减少数据工程方面的工作?