如何在Azure认知搜索中设置爬网规则以仅索引以特定字母开头的文件?

问题描述 投票:0回答:1

[如何在Azure认知搜索中设置爬网规则以仅索引以特定字母开头的文件(例如带有Prefix Invoice_等的文件)?这样就不会抓取Blob存储中的其他文件。

斯瓦特

microsoft-cognitive
1个回答
0
投票

关于此查询,我得到了Azure搜索产品团队的答复:索引器仅允许您根据文件的扩展名或基于它们所在的容器来过滤要索引的文件(文档:https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage)。 。因此,如果您要按前缀过滤,我想到的唯一方法是实际创建一种自定义技能,该技能可以接受metadata_storage_path字段和内容,并且仅在路径/文件名符合您要查找的任何模式时才输出内容。这需要一些努力(创建custom skill),但这是可行的。

© www.soinside.com 2019 - 2024. All rights reserved.