哪种方法更适合发票提取 - RAG 或非 RAG。考虑到我有大约 60K 的发票,它们的结构非常不同?另外,使用多代理框架是个好主意吗?
您的意思是从发票文档中提取信息吗?
我建议的高级步骤是:
第 0 步。创建一个脚本来循环遍历发票文档
步骤 1. 从每个文档中提取文本。
第 2 步。将文本连同提示(提示工程)传递给 LLM 并提取您需要的信息。