使用ElasticSearch / Symfony从pdf文件获取数据

问题描述 投票:0回答:1

实际上我正在使用Symfony并且我已经集成了ElasticSearch,我想从Pdf文件(名称,年龄,地址)/或文本文件中提取数据,以便获得一个填充数据的表单如何做到这一点? Ps:我已经配置了elastic.yml我已经添加了所有的索引,当我访问了127.0.0.1:9200时,我的对象成功(json格式)我想要的是如何从pdf文件中读取并检索所有数据

symfony elasticsearch elasticsearch-5 elasticsearch-plugin symfony-2.8
1个回答
0
投票

你必须使用像https://pdfparser.org/documentation这样的pdf解析库

$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

$text = $pdf->getText();
echo $text;
© www.soinside.com 2019 - 2024. All rights reserved.