我正在检查 Tika 的 NER 任务并运行 NER 示例。我可以通过点击 documented 元端点来获取我的文件元数据:
curl -T test.txt http://localhost:9998/meta --header "Accept: application/json" | jq
如何进行NER?
从 Apache Tika 网站下载 Tika Server 并启动它
java -jar tika-server.jar
使用curl将文件发送到Tika服务器进行NER
curl -T yourfile.txt http://localhost:9998/ner --header "Accept: application/json" | jq
将
yourfile.txt
替换为您要分析的文件的路径。
注: Tika 的 NER 功能可能不如专用工具先进,但这种方法可以提供基本的 NER 功能。
#阿帕奇时代