适用于 Firebird 2.5。
我有一个表 T,其索引由 2 列组成,例如 ColA 和 ColB。如果我这样做:
SELECT * FROM T WHERE ColA=...
,所以 WHERE 子句仅在 A 列上,Firebird 是否会为 ColB 列设置默认值,以及索引的好处,还是根本无法使用该索引?
一些背景: 我正在进行数据库升级。这是我所拥有的:
CREATE TABLE user(
newid BIGINT NOT NULL,
oldid BIGINT NOT NULL,
anotherCol INT);
CREATE INDEX idx ON user(oldid, anotherCol);
CREATE TABLE order(
RefUser BIGINT);
order.RefUser 是oldid,我需要将它们更改为newid。我使用这个查询来做到这一点:
UPDATE order o SET o.refuser = (SELECT u.newid FROM user u WHERE u.oldId = o.refuser);
此时,oldid 仍然是唯一的,但稍后只会保证 (oldid, anotherCol) 的唯一性,因此需要索引,以及 newid 的创建。
用户表有几百万条记录,订单表有几千万条:这个查询需要一个多小时。我想看看如何改进它(不热衷于在这段时间内关闭关键服务)。
假设索引统计信息是最新的,或者至少对于优化器来说足够好,那么当并非所有列都是 where 子句的一部分时,Firebird 可以(并且经常会)使用多列索引。唯一的限制是它只能将其用于第一列(或索引的“前缀”)。
所以
CREATE INDEX idx ON user(oldid, anotherCol);
Firebird 可以使用索引
idx
来表示 where oldid = 'something'
,但不适用于 where anotherCol = 'something'
。
不,Firebird 不会 “为列 [anotherCol] 设置默认值”。它对索引进行范围扫描并返回具有匹配
oldid
前缀的所有行。
从技术上讲,Firebird 通过组合列来创建索引键,如Firebird for the Database Expert: Episode 1 - Indexes中所述,这意味着索引中的值类似于:
0<oldid> 1<anotherCol> : row_id
例如(简化后,现实生活中 Firebird 也会进行前缀压缩)
0val1 1other1 : rowid1
0val1 1other2 : rowid4
0val1 1other3 : rowid6
0val2 1other1 : rowid2
...
使用
where oldid = 'val1'
时,Firebird 将在索引中搜索以 0val1 1
开头的所有条目(就像在单列上对 0val1 1%
进行字符串搜索一样)。在这种情况下,它将匹配 rowid1、rowid4 和 rowid6。
虽然这可行,但如果您仅在
oldid
上进行大量查询,则最好仅在 oldid
上创建单列索引,因为该索引会更小,因此在搜索记录时可以更快地遍历。当然,缺点是更多的索引会对插入、更新和删除的性能产生影响。