如何从 Azure AI 搜索的查询响应中追溯文档内的内容来源?

问题描述 投票:0回答:1

我最近才接触到 Azure AI 搜索,所以如果这是一个微不足道的问题,请原谅我。

当我研究微软的演示视频时,我看到用户点击从ChatGPT返回的引用链接后,它会在右侧打开一个页面,显示pdf文件的来源。

但是,我很难看到如何根据 Azure AI 搜索查询结果跳转到内容(如演示)。使用 Azure 控制台导入和矢量化数据后,我只能从 API 响应中看到 chunk、chunk_id、parent_id 和 title。标题提示我该块来自哪个文档,但没有提及文档中的“位置”。我还注意到 chunk_id 有一个表示页码的后缀,但我不确定这是否是正确的方法。

所以我的问题是:

  1. 使用 chunk_id 后缀是追溯文档中内容位置的正确方法吗?
  2. 如果没有,我如何修改索引器以包含告诉我它在文档中的位置的元数据?

我已经花了几天时间查看 Azure 文档,但我很难找到任何可以回答我的问题的参考资料。我还阅读了文章text,但它没有非常清楚地解释如何定义自定义可检索字段。如果有人能告诉我它是如何完成的,我将非常感激。预先感谢!

azure indexing azure-openai vector-search azure-ai-search
1个回答
0
投票

要获得正确的引用和结果,您应该在索引中包含以下字段,以便您在将自己的数据链接到 Azure OpenAI 服务中的聊天平台时映射它们:

  1. 内容数据
  2. 文件名
  3. 标题
  4. 网址

因此,每当您通过 AI 搜索添加链接数据时,请选中自定义字段映射,以便您可以选择字段。

enter image description here

然后如下图所示绘制它们。

enter image description here

在这里,我选择了

filepath
文件名,以便它提供对该文件的引用。

输出:

我在聊天中要求

windows server key features?

enter image description here

在索引中:

enter image description here

© www.soinside.com 2019 - 2024. All rights reserved.