在进行数据库规范化时，什么是将重复的行信息集组合成新的实体？

2024-01-14

我对数据库规范化的某个部分有点困惑，我想我应该问 StackOverflow：

想象一下，您有以下将产品与颜色联系起来的关系。请注意，产品 1 和产品 2 都使用同一组颜色（蓝色和绿色）。

Product_Color                         Color
+-------------+-------------+     +-------------+-------------+
| Product*    | Color*      |     | ColorId*    | Name        |
+-------------+-------------+     +-------------+-------------+
| 1           | 1           |     | 1           | Blue        |
| 1           | 2           |     | 2           | Green       |
| 2           | 1           |     +-------------+-------------+
| 2           | 2           |
+-------------+-------------+

如果我创建两个新关系 ColorSet 和 ColorSet_Color，我可以通过将 4 个关系连接在一起来显示相同的信息。

Product_ColorSet:                 ColorSet_Color:             
+-------------+-------------+     +-------------+-------------+
| Product*    | ColorSetId* |     | ColorSetId* | ColorId*    |
+---------------------------+     +-------------+-------------+
| 1           | 1           |     | 1           | 1           |
| 2           | 1           |     | 1           | 2           |
+-------------+-------------+     +---------- --+-------------+

ColorSet:                         Color:
+-------------+                   +-------------+-------------+
| ColorSetId* |                   | ColorId*    | Name        |
+-------------+                   +-------------+-------------+
| 1           |                   | 1           | Blue        |
| 2           |                   | 2           | Green       |
+-------------+                   +----------[--+-------------+

此时，如果我有一个大型 Product_Color 表，并且具有合理程度的共享颜色组，那么从空间角度来看，我将获得相当大的收益。

在数据库规范化的背景下，此操作的技术名称是什么？我显然正在删除冗余信息，即使我创建的实体实际上并不存在，这更像是存在大量重叠的随机机会。我这样做具体要改变什么？

此外，似乎我可以对大多数实体任意执行此操作。让我困惑的是，当我们开始练习时，Product_Color 和 Color 已经处于第六范式（对吗？）。

您正在介绍一个“代理键 https://en.wikipedia.org/wiki/Surrogate_key“（或标识符）到name/identify产品所采用的颜色集。替代方案通常被认为是“自然键 https://en.wikipedia.org/wiki/Natural_key“（或标识符）。（尽管不同的人在细节上使用这些术语的方式不同。例如，当名称/标识符被永久分配给所指对象和/或其所指对象的唯一名称/标识符和/或其是时，有些人可能仅使用“代理”仅在数据库中可见，而在应用程序中不可见。例如，有些人会说外部可见的系统生成的任意名称/标识符（如驾驶员识别号）既是替代项又是自然项。）

代理键通常被称为“无意义（标识符）”。这反映了思想的混乱。All不是由先验命名方案生成的名称是“无意义的”且任意的。 “尼古拉斯”并不是“意思”you直到被选中；一旦被选中，它就“意味着”你。这适用于any名称/标识符。因此，“无意义”/“有意义”并不是一个有用的区别。系统中的代理名称/标识符只是系统启动后选择的名称/标识符。当在之前存在的任何系统中分配时，系统中被称为“有意义”[原文如此]的东西将被称为“无意义”[原文如此]（因为分配是在之后）it开始）。

有一种“视角”是“删除冗余信息”，但这不是规范化所解决的那种冗余。您正在用其他表替换一个表，但这不是规范化分解。引入代理人并不是正常化的一部分。规范化不会引入新的列名称。它只是在替换它的表中重用原始表的名称。（你能清楚准确地描述一下这里的“冗余”是什么意思吗？）

有时人们认为，如果相同的值子元组可以在列集或表中出现多次，那么这些子行值需要替换为 id，这些 id 是新表的 FK，将 id 值映射到子行值。（甚至可能对于单列子行，即当单个值在列或表中出现多次时。）他们认为多个子行值出现是“冗余的”，或者只有 id 可以重复而不是“冗余”。（id设计被视为原始数据的一种压缩。）他们可能认为这是规范化的一部分。但事实并非如此。 https://stackoverflow.com/a/32036030/3404097

这不是您应该通过表格设计来解决的冗余问题。If您知道 DBMS 对表的实施选项and您了解应用程序的使用模式and你知道原来的选项显然比某些恰好“冗余度较低”的选项更糟糕（为什么“冗余度更高”的选项不会更好？）then如果可以的话，您应该告诉 DBMS 您的设计需要什么选项，而不需要更改架构。（这通常是通过索引和/或视图完成的。）例如，在 ColorId 上索引原始 Product_Color 会导致实现中的结构与您在第二个设计中手动创建的结构基本相同，但会自动生成和管理。（您可能会引入代理other原因，例如用更简洁但更模糊的值和约束的外键替换多列外键。）

重新选项：您的新设计将使用更多操作（例如连接和投影）在查询文本中并且（对于典型的 DBMS 实现）执行比原始（例如查询原始表）但是fewer其他地方（例如，将一个产品的颜色设置复制到另一个产品的颜色设置）。所以这又是关于权衡 of multiple“观点”。

事实上你在另一种意义上引入冗余与代理人。还有一些附加列保存了原始中没有的一堆 id 值，但记录了相同的情况。您还给用户带来了更多命名和间接设计的负担。与原始设计相比，替代设计在这个“视角”中肯定有很多“冗余信息”。

甚至您的初始设计也可能引入了代理，即颜色名称的颜色 ID。（如果颜色 ID 添加了“信息”，即“通知”您的不仅仅是它们的相关名称，那么它们就不是替代品，而且是必要的。）即，如果颜色 ID 是任意选择的，那么您可以：

Product_Color
+-------------+-------------+
| Product*    | ColorName*  |
+-------------+-------------+
| 1           | Blue        |
| 1           | Green       |
| 2           | Blue        |
| 2           | Green       |
+-------------+-------------+

你应该有一个reason引入颜色 ID，以及就此而言的产品 ID，而不是已经存在的自然键。你可以吗justify您的多个表、名称和间接寻址与只有一个？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

databasedesign

databasenormalization

在进行数据库规范化时，什么是将重复的行信息集组合成新的实体？的相关文章

用户评级的 ER 模型

我有很多用户每个用户最多有 5 个服务用户应该能够对每项服务进行评分 0 5 我还想保留用户的平均评分这是我的想法但是还有更好的方法吗 User id user name dob 服务固定数量的服务 id service de
如何设计多租户mysql数据库[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案假设我需要设计一个数据库来托管多个公司的数据现在出于安全和管理目的我需要确保不同公司的数据正确隔离但我也不想启动 10 个 m
数据库、表和列命名约定？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案每当我设计数据库时我总是想知道是否有命名数据库中项目的最佳方法我经常问自己以下问题表名应该是复数吗列名应该是单数吗我应该为表或列添加前
子查询与连接

我重构了从另一家公司继承的应用程序的一个缓慢部分以使用内部联接而不是子查询例如 WHERE id IN SELECT id FROM 重构后的查询运行速度提高了约 100 倍 50 秒到 0 3 我预计会有改进但谁能解释为什么它如此剧
设计 Cassandra 数据模型的最佳实践是什么？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案以及需要避免哪些陷阱您有任何交易中断吗例如我听说导出导入 Cassandra 数据非常困难这让我想知道这是否会妨碍将生产数据
如何在 SQL 中存储目标（例如 RPG Quest）

今天有人问我他们应该如何将任务目标存储在 SQL 数据库中在这种情况下请考虑角色扮演游戏目标可能包括以下一些内容发现地点杀死 n MOB 类型获取对象的 n 个实现技能组中的技能你在角色扮演游戏中获得的所有其他东
如何使组合键唯一？

I am making a database of students in one school Here is what I have so far 如果您不喜欢阅读请跳至简而言之部分问题是我对这个设计并不满意我想要的组合gra
Django 选择性转储数据

是否可以有选择地过滤哪些记录Django的dumpdata管理命令输出我有几个模型每个模型都有数百万行我只想转储一个模型中符合特定条件的记录以及引用任何这些记录的所有外键链接记录考虑这个用例假设我有一个生产数据库其中我的用户模
当两个表非常相似时，什么时候应该将它们合并？

我有事件和照片然后对两者进行评论现在我有两个评论表一个用于与事件相关的评论另一个用于照片评论架构与此类似 CREATE TABLE EventComments CommentId int EventId int Comment
数据库分区 - 水平与垂直 - 规范化和行拆分之间的区别？

我试图理解不同的概念数据库分区这就是我的理解水平分区分片将表拆分为不同的表其中将包含初始表中的行的子集如果按大陆拆分用户表我见过很多这样的示例例如北美的子表欧洲的另一个子表 ETC 每个分区位于不同的物理位置理解机器据
parent_id 是外键（自引用）并且为 null？

浏览 Bill Karwin 的书 SQL Antipatterns 第 3 章 Naive Trees 邻接表父子关系有一个注释表的示例 CREATE TABLE Comments comment id SERIAL PRIMARY
列太多的表的缺点

我有一些数据需要放入 PostgreSQL 数据库中这些数据与学校有关所以有很多与学校相关的属性大部分是小整数浮点数或小文本所有数据每年都会发生变化所以我正在创建一个名为的实体YearlyData并将属性放在那里但问题是属性
软删除最佳实践（PHP/MySQL）

Problem 在处理产品和订单的 Web 应用程序中我想维护前员工用户与他们处理的订单之间的信息和关系我想维护过时产品和包含这些产品的订单之间的信息和关系然而我希望员工能够整理管理界面例如删除前员工过时的产品过时的产品组
非规范化如何提高数据库性能？

我听说过很多关于非规范化的内容它是为了提高某些应用程序的性能而进行的但我从来没有尝试过做任何相关的事情所以我只是好奇规范化数据库中的哪些地方会使性能变差或者换句话说非规范化原则是什么如果我需要提高性能如何使用此技术非规范
是否需要连续编号？

我正在开发一个 winform NET 应用程序其中包括订单发票服务订单票务等这些实体在对其 ID 进行编号时是否必须按顺序排列国际海事组织没有以一个订单为例它只有通过业务层才有效在此过程中可能已经创建了另一个订单批准
数据库设计1对1关系

我的数据库设计不正确我应该在开发过程中解决这个问题吗假定 user 表与 userprofile 表具有 1 1 关系然而实际设计中用户表与用户配置文件表具有 1 关系一切正常但无论如何应该修复它吗做一件事 User
“多对二”关系

我想知道多对二关系孩子可以与两个父母中的任何一个有联系但不能与两个父母都有联系有什么办法可以加强这一点吗另外我想防止孩子重复输入现实世界的例子是电话号码用户和公司一个公司可以有很多电话号码一个用户可以有很多电话号码但理
Rails 5：迭代的数据库设计

我目前有一个包含用户餐食和订单表的网站 Users表保存用户信息餐食表包含餐食名称描述 img url 我目前正在使用迭代来显示餐食 span class mealname span p p p p div class qty INP
核心数据模型设计

假设我有一个关于烹饪食谱的应用程序具有两个基本功能第一个涉及我正在准备的当前食谱第二个存储了我决定保存的食谱标准场景我目前的食谱是芝士蛋糕 RecipeDetailViewController我可以看到我为此食谱添加的当前成分
修订：算法和数据结构

我需要通过修订来构建和处理数据的想法例如我有一个对象数据库例如汽车每个对象都有许多属性这些属性可以是任意的因此没有一个固定的模式来描述这些对象这些对象可能保存为键值对现在我需要更改对象的属性我不想完全重写它我希望能够返回

随机推荐

临时表范围？

我在存储过程中使用临时表 tempTable 我用它来运行 ASP net 报告报告服务我正在做类似的事情 eg Code SELECT INTO tempTable FROM Contacts WHERE ContactID lt 1
引用 JSON (Javascript) 对象的元素

如何引用 JSON Javascript 对象的元素示例 alert homes Agents 1 name
如何使用 Android 地图实用程序库显示 InfoWindow

我在用着Google 地图 Android API 实用程序库 http googlemaps github io android maps utils 为了以集群的方式显示地图中的多个标记我已按照说明进行操作并查看了库中的示例但我不
Jasper Reports 中的空白子报表

我正在尝试启动我在 iReport 中创建的报告其中包含主报告和子报告在 iReport 中子报表启动正常并包含数据但是当我尝试从 java 代码中启动它时子报表为空到目前为止我所做的我在主报告中有一个名为 SUBREPORT
单元格为空，但 IsEmpty 不起作用

我正在编写一个 IF 语句它使用 IsEmpty 函数来确定 True 或 False 我在具有值例如 PRB2039 的单元格和空白单元格上尝试了它来测试我的代码结果是相同的我删除了格式并在新工作表上尝试了它我不知道我做错了什
哪里可以找到 C++11 参考论文/数字以及书籍参考 [重复]

这个问题在这里已经有答案了可能的重复 c 11标准在哪里 https stackoverflow com questions 7747069 where is the c11 standard 我想购买下载一些东西首先我想要官方 c
Ruby 2.3 安全导航运算符 '&. 之间有什么区别？和“尝试！”来自 ActiveSupport 的方法？

是否是安全操作员从 Ruby 2 3 开始try ActiveSupport 中的方法可以互换吗如果不是它们之间有什么区别一个关键的区别是try 是一个额外的方法调用而不是我能想到这会造成一个诚然是人为的差异 1234 g
MapView 注释中的较长字幕（swift）

我有一个带有显示标题和副标题的注释的地图视图字幕有时比注释的宽度长所以我想知道是否可以使它们成为多行到目前为止它的编码是这样的 func annotate newCoordinate title String subtitle Str
用静态类型语言实现干净且类型安全的状态机？

我用 Python 实现了一个简单的状态机 import time def a print a return b def b print b return c def c print c return a if name main stat
使用 awk 根据两个字段删除文件中的冗余

我试图根据前两列的值删除一个非常大的文件约 100 000 条记录中的重复行而不考虑它们的顺序然后打印这些字段其他列所以根据这个输入 A B XX XX A C XX XX B A XX XX B D XX XX B E XX
如何使用pymc参数化概率图模型？

如何使用 pymc 参数化概率图形模型假设我有一个带有两个节点的 PGMX and Y 可以说X gt Y是图表 And X有两个值 0 1 and Y也有两个值 0 1 我想使用 pymc 来学习分布的参数并填充用于运行推理的图形模型
如何将CAS认证与Spring Security集成？

我已将 spring security 集成到我的项目中并且之前使用 hibernate 验证用户详细信息现在我必须使用 CAS 来完成它这是我当前的 Spring security xml
Django 将 ImageField 指向已经存在的图像

我有一个具有图像字段的模型 class Foo models Model image models ImageField upload to bar blank True 我正在使用 urllib 通过互联网下载图像如下所示 urllib
如何告诉 VScode 将文件类型 A 格式化为文件类型 B，同时保留语法突出显示？

我遇到了这个问题在 VScode 中格式化 vue 文件时如何保留空行 https stackoverflow com questions 60930318 how to preserve empty lines when formatt
如何在 Visual Studio Code 中禁用语法着色

我想完全禁用语法着色我尝试禁用参数提示但这没有任何效果是否可以让编辑器只有前景色背景色而没有其他颜色你可以加 files associations plaintext to settings json
正则表达式可以在 regex101.com 上运行，但不能在 python 中运行

我正在尝试创建一个函数该函数获取文件夹名称数组和数字该函数应返回哪个季节文件夹并且我想检查是否存在具有正确季节编号的文件夹 Staffel 德语季节但是我不只是拥有简单的英语电视节目因此我的文件夹名为 Staffel 德国电视节目
在 STL 中将 char 缓冲区附加到 vector

附加 C 缓冲区内容的正确且有效方法是什么 char 到最后std vector
如何存储我的“子网站”的根目录[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我需要将我的网络应用程序添加到现
Vue：无法在输入 vue-router 之前访问 Pinia Store

我正在使用 Vue 3 包括 Composition API 另外还使用 Pinia 作为状态管理在选项 API 中有一个方法 beforeRouteEnter 该方法内置于组件本身中不幸的是这个方法在组合 API 中不存在这里
在进行数据库规范化时，什么是将重复的行信息集组合成新的实体？

我对数据库规范化的某个部分有点困惑我想我应该问 StackOverflow 想象一下您有以下将产品与颜色联系起来的关系请注意产品 1 和产品 2 都使用同一组颜色蓝色和绿色 Product Color Color Product

在进行数据库规范化时，什么是将重复的行信息集组合成新的实体？

在进行数据库规范化时，什么是将重复的行信息集组合成新的实体？ 的相关文章

随机推荐

热门标签

在进行数据库规范化时，什么是将重复的行信息集组合成新的实体？的相关文章