哪些数据类型为多个引用?

问题描述 投票:0回答:1

我需要最快的性能的方法来检索需要被快速拉升整数。这里是我的使用情况:有一个“排序/过滤器”在我的网站选项。我对狗的属性,如长发,短发,大,狗,等等......我希望用户能够通过狗的属性进行过滤。

这里是我的表:

dogs
- id
- attributes

下面是引用有关狗的属性(这个问题不是很重要,它只是给你一个想法):

0 = adoptable pet
1 = short hair
2 = long hair
3 = fluffy
4 = black
5 = brown
6 = white
7 = golden/yellow
8 = etc...

现在,我已经保存在JSON格式的TEXT数据类型的属性。例如,["0","4"]["0"]["2"]

所以我想选择所有像这样的属性:

SELECT * FROM dogs WHERE attributes LIKE %0% OR attributes LIKE %1% OR attributes LIKE %4% attributes LIKE %7%

如何可以选择其中的属性包含0,或1,或4,或7(不和)的所有行。如果行有这些属性之一,选择它们。

什么是接近它的最佳方法是什么?我应该JSON数据类型存储在MySQL或我应该做些别的事情?我希望能够SELECT和快速拉起。我觉得我有它的方式LIKE不会非常快。

什么是特别是数以百万计的几十万行的最好和最快的方法是什么?

谢谢先进!

php mysql database performance pdo
1个回答
3
投票

以逗号分隔的列表是有问题的反模式。 (比尔Karwin给在他的书SQL反模式的精彩演讲:避免数据库编程的陷阱,所以我不打算深究为什么我们要避免这种情况的讨论相反,我要跳进一个证明。图案通常用于实现多值的属性。)


规范的关系模式将是创建一个表上每行一个属性。例如是这样的:

CREATE TABLE dog_attribute 
( dog_id  int not null comment 'fk ref dog.id'
, attr    int not null comment '1=adoptable, 2=...'
, PRIMARY KEY (dog_id, attr) 
, CONSTRAINT FK_dog_attribute_dog FOREIGN KEY dog_id REFERENCES dog (id)
  ON UPDATE CASCADE ON DELETE CASCADE
, UNIQUE KEY dog_attribute_UX (attr, dog_id)
);

--

为给定dog_id添加三个属性,我们添加三行:

INSERT INTO dog_attibute (dog_id, attr) VALUES
 (1,2)
,(1,3)
,(1,5)

--

有几种可能的查询模式。由于几个简单的例子:

要找到既具有属性2和属性3 dog_id,我们可以这样做:

SELECT da.dog_id 
  FROM dog_attribute da
 WHERE da.attr IN (2,3) 
 GROUP
    BY da.dog_id 
HAVING COUNT(1) = 2 

有迹象表明,得到相同的结果的其他查询模式,例如

SELECT da.dog_id 
  FROM dog_attribute da
  JOIN dog_attribute dd
    ON dd.dog_id = da.dog_id 
   AND dd.attr = 3
 WHERE da.attr = 2

第一个查询模式可以扩展到找到dog_id有至少两个一组给定的属性的。例如

 WHERE da.attr IN (2,3,5,7)

HAVING COUNT(1) >= 2

第二个查询可以扩展来添加连接和反连接的各个属性,

--

要查找具有属性2行,要么(或两者)属性3和4,和既没有属性7或8,我们可以做这样的事情:

SELECT da.dog_id 
  FROM dog_attribute da
  LEFT
  JOIN dog_attribute dn 
    ON dn.dog_id = da.dog_id 
   AND dn.attr IN (7,8) 
 WHERE dn.dog_id IS NULL 
   AND da.attr = 2
   AND EXISTS ( SELECT 1 
                  FROM dog_attribute de
                 WHERE de.dog_id = da.dog_id 
                   AND de.attr IN (3,4)
              )

(反连接排除dog_id有属性7,...)


如果如上证明我无法实现一个表模式,...如果我绝对必须使用逗号分隔的列表,在一个单一的列,以保存多个属性......一个小的,静态的属性集(表定义中定义,不能动态地添加或删除)我会使用MySQL SET数据类型。

https://dev.mysql.com/doc/refman/8.0/en/set.html

 attributes  SET('','adoptable','short hair','long hair','fluffy','black','brown','white','golden')

和查询,我们可以这样做:

WHERE FIND_IN_SET('black',t.attributes)
  AND FIND_IN_SET('long hair',t.attributes)
© www.soinside.com 2019 - 2024. All rights reserved.