jena TDB2使用哪些指数?

问题描述 投票:1回答:1

我试图找出TDB2构建的索引。我通过代码发现它使用B +树将它们存储在光盘上,但我没有得到它们包含的内容以及它们的使用方式。

所以我的详细问题是:

  • RDF三元组的整理顺序(如SPO,SOP,POS,PSO ......)是否构建了指数?
  • 如何编码和存储RDF术语?
  • 使用什么策略将索引加载到主内存中? (我希望分页)?

如果你能指点我的白皮书或类似TDB2的软件设计,它也会对我有所帮助。我搜索它但找不到任何东西。

apache jena indices tdb
1个回答
2
投票

TDB2对每个RDF术语都有一个“id”(文字的URI,空白节点)。 id是固定长度64.另一种说法是保留字典。

对于三元组,它保留了SPO,POS和OSP(这是可配置的,但这是默认设置)。三元组作为那些ID存储在索引中 - 因此每个三元组有3个ID。固定长度。

默认情况下,索引是堆外部的内存映射文件。它们提供了良好的可用性。

这是当前的默认设置。代码隔离了例如64位ID可能更长,不同的索引选择。

© www.soinside.com 2019 - 2024. All rights reserved.