我正在构建一个依赖于EAV pattern来存储数据的Web应用程序。这基本上意味着对象的每个属性在海量数据库表中都有自己的行。我正在使用MySQL存储所有内容。这是我存储的一个非常简单的例子......
OBJECTS ATTRIBUTES
objId | type objId | attribute | value
============= =========================
1 | fruit 1 | color | green
2 | fruit 1 | shape | round
3 | book 2 | color | red
我知道有些人讨厌EAV,但我需要能够在不修改数据库模式的情况下随意添加新的对象属性,到目前为止它对我来说非常有用。
正如我想其他人在使用EAV数据结构构建系统时发现的,这种方法的缺点是多个对象与每个对象的属性一起被检索。目前我的应用程序一次只显示10个对象,所以我只查询我的EAV表10次(每个对象一次),它仍然非常快。但是,我想删除此限制并允许一次获取数百个对象。我还希望能够以比我目前更灵活的方式查询对象。
使用SQL连接执行此操作将是可怕的,因此我正在考虑缓存数据。平均而言,数据库每写1次就会获得大约300次读取,所以我认为这是缓存的一个很好的候选者。
到目前为止,这些是我提出的选择......
最初我认为XML文件是最好的方法,但我可以看到文件变得非常庞大且难以管理。目前我倾向于使用MongoDB。我知道为一个应用程序运行两个数据库服务器似乎很疯狂,但我认为它可以在我的情况下工作。
我很想听听你对此的看法。
我只看到两种方式,在评论中都提到了这两种方式。
首先,您可以真正迁移到像Mongo这样的面向文档的数据库 - 这适合作为EAV的替代方案。由于它不会是JOIN和其他逻辑,因此速度非常快且略有缩放。 (所以,也许你可以避免使用缓存)。
其次,您可以使用特定工具进行缓存,如Redis或Mongo或Memcached,以保存每个查询结果一段时间。
但我想转而关注这个系统的未来。什么是计划加载和缩放?如果您想减少系统负载,我认为最好的方法是迁移到面向文档的数据库。或者,如果你想立即得到结果(缓存数据用于阅读) - 可以通过使用缓存工具,甚至[如果可能]在网络级别(例如nginx支持memcached开箱即用)来实现。
因此,像往常一样,您应该在一次性成本和持续成本之间找到平衡点。