有关重复数据的SQL

问题描述 投票:1回答:1

我有一个关于数据规范化的一般问题(我的第一步到SQL)。我收到了一个CSV文件,我已将其上传到MySQL工作台,并被要求进行数据规范化(使用普通表格)。我发现了一些明显的重复,但我不确定一件事。有关于公司及其地址的数据,但是,例如在“国家”字段中,美国重复了几千次,我不确定这是否算作重复数据?我应该制作单独的表格,例如“国家/地区”并给它们提供唯一的ID,让我们说美国1,然后更新原始表中的数据,其中有美国用1替换它?

mysql sql duplicates mysql-workbench database-normalization
1个回答
0
投票

如果你想消除重复,那么'UNITED STATES'确实是重复的。

因此,如果您的目标是规范化,则需要一个countries参考表。

请注意,在这种情况下,规范化可能会减小数据的大小。 countries表的密钥可能是一个整数(4个字节) - 尽管它也可以是ISO 2字符或3个字符的国家代码。重复原始表中的主键应减少数据库中数据的总大小。

© www.soinside.com 2019 - 2024. All rights reserved.