如何为Azure文档Intelligence Bank声明提取的自动文档分开 我目前正在使用AI文档智能中的预先构建的银行声明数据提取器。但是,我的PDF通常可以包含多个银行语句。从我的理解来看,默认拆分是...

问题描述 投票:0回答:1
split_mode

参数中实现分裂,但它不起作用。

poller = document_intelligence_client.begin_analyze_document( model_id="prebuilt-bankStatement.us", body=file_bytes,split_mode=SplitMode.AUTO ) bankstatements = poller.result()

TypeError:session.request()有一个意外的关键字参数'split_mode'


    

                
i我尝试在

split_mode

参数中实现分裂,但它不起作用。
azure azure-document-intelligence
1个回答
0
投票
振动文档智能确实支持文档拆分
,但这取决于模型。处理时,一些预制模型(例如,

prebuilt-invoice

prebuilt-receipt

)会自动拆分文档。

prebuilt-bankStatement.us在官方文档中没有完全提及自动拆分。

由于
prebuilt-bankStatement.us
确实不正式支持拆卸,您可以在发送它们之前手动将PDF手工分配到单个语句中。

培训自定义模型
    以识别和拆分银行语句。
  • 或其他将文档集成到Azure之前,然后在您可以单独分析它们之后。
    代码:

for file in os.listdir("output_statements"): file_path = os.path.join("output_statements", file) with open(file_path, "rb") as f: file_bytes = f.read() poller = client.begin_analyze_document( model_id="prebuilt-bankStatement", analyze_request={"content": file_bytes} ) result = poller.result() print(f"\n Results for {file}:") print(result)

    
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.