数据仓库 - 星型模式与扁平表

2024-02-13

我正在尝试为财务系统、项目调度系统和无数科学系统等常用数据的单一存储设计一个数据仓库。 IE。许多不同的数据集市。

我一直在阅读数据仓库和流行的方法，例如星型模式和 Kimball 方法等，但我找不到答案的一个问题是：

为什么将 DW 数据集市设计为星型模式而不是单个平面表更好？

当然，事实和属性/维度之间没有联接比对所有维度表进行大量小联接更快、更简单？磁盘空间不是问题，如有必要，我们将在数据库中添加更多磁盘。如今，星型模式是否有点过时了，或者它仍然是数据架构师的教条？

你的问题很好：维度建模的 Kimball 口号是提高性能和可用性。

但我不认为它已经过时，也不是教条——对于许多情况和平台来说，它是一种合理、实用的方法。

关系数据库存储数据的方式意味着表的数量和类型、典型查询的数据路由、数据之间关系的易于维护性和描述、连接数量、连接方式之间需要达到平衡构造、列的可索引性等。

3NF（或更进一步）是该范围的一端，适合 OLTP 系统，而单个表是该范围的另一端。维度模型位于中间，适合报告，至少在使用某些技术时是这样。

性能并不完全与“连接数量”有关，尽管星型模式在报告工作负载方面比完全规范化的数据库表现更好，部分原因是连接数量减少。尺寸通常非常宽。如果您在每个事实的每一行中都包含所有这些维度字段，那么您确实拥有非常大的行，并且对于典型的查询来说，找到进入这些行的方式将会表现得非常糟糕。

事实有很多，因此，如果您可以使这些表变得紧凑，并且可以过滤“更冗长”的维度，那么您将达到单个表无法匹配的性能最佳点，除非有大量索引。

是的，事实的单个表格在表格数量方面更简单，但它真的更容易导航吗？维度和事实是易于理解的概念，如果您想跨事实进行交叉查询该怎么办？您拥有许多不同的数据集市，但拥有数据仓库的好处之一是，这些数据集市并没有明显的区别——它们是相关的并且可以相互报告。一致的尺寸可以实现这一点。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

datawarehouse

starschema

数据仓库 - 星型模式与扁平表的相关文章

Oracle中是否可以部分刷新物化视图？

我有一个非常复杂的 Oracle 视图基于其他物化视图常规视图以及一些表我无法快速刷新它大多数时候此视图中的现有记录基于日期并且是稳定的新记录集具有新日期有时我会收到回溯日期我知道这些是什么以及如果我维护一张桌子如何
事实表是标准化形式还是非标准化形式？

我对事实表做了一些研究和开发无论它们是标准化的还是非标准化的我发现了一些让我困惑的发现根据Kimball 维度模型结合了规范化和非规范化的表结构描述性信息的维度表是高度非规范化的在同一个表中具有详细且分层的汇总属性同时具有性能
将 SQL Server 数据库数据移至 SAP BW

我读过一些关于将数据从 SAP BW 移入 SQL Server 的文章我找不到任何有关将数据从 SQL Server 移动到 SAP BW 的文章这是否可能如果可以处理此问题的最佳方法是什么在搜索这个主题后我发现了许多解决这个
数据仓库的日历表

对于我的数据仓库我正在创建一个日历表如下所示 SET NOCOUNT ON DROP Table dbo Calendar GO Create Table dbo Calendar CalendarId Integer NOT NULL
Oracle 中的分组依据与分区依据

我正在编写一个查询来从 Oracle 仓库中获取记录它是一个简单的选择查询在几个表上进行连接并且我有几个要聚合的列因此我最终在其余列上使用 Groupby 假设我选择了大约 10 列其中 5 列是聚合列所以我需要对其他 5 列进
数据仓库 - 具有多对多关系的缓慢变化的维度

举个例子假设我有一个包含两个维度和一个度量的事实表事实货币表项目密钥 int PersonKey 整数现金金额两个维度的定义如下 DimProject 0 型维度即静态项目密钥 int 项目名称 varchar 50 DimP
是否应该对 OLAP 数据库进行非规范化以提高读取性能？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我一直认为数据库应该针对读取性能进行非规范化就像针对 OLAP 数据库设计所做的那样而不是针对 OLTP 设计进一步夸大 3NF 各种职位的
在 hive 中生成星型模式

我来自 SQL 数据仓库世界我通过平面提要生成维度和事实表在一般的数据仓库项目中我们将数据源分为事实和维度前任我对 Hadoop 完全陌生我开始知道我可以在 hive 中构建数据仓库现在我熟悉了使用 guid 我认为它可以用
如何对数据仓库中的流程和状态历史进行建模？

假设我们有D PROCESS D WORKER and D STATUS作为尺寸和事实F EVENT将流程内容与工作人员负责人和当前状态联系起来进程状态随时间而变化我们应该存储在F EVENT每个进程状态工作人员一行或
数据仓库中的时间和日期维度

I m building a data warehouse Each fact has it s timestamp I need to create reports by day month quarter but by hours to
使用 SSIS 将 SQL Azure 联合数据库提取到数据仓库

我正在尝试将我们的生产数据传输到数据仓库以用于报告目的我尝试按照导入到联盟部分进行操作用于 Azure 和混合数据移动的 SSIS http msdn microsoft com en us library jj901708 aspx
数据仓库 - 星型模式与扁平表

我正在尝试为财务系统项目调度系统和无数科学系统等常用数据的单一存储设计一个数据仓库 IE 许多不同的数据集市我一直在阅读数据仓库和流行的方法例如星型模式和 Kimball 方法等但我找不到答案的一个问题是为什么将 DW 数据集市设
数据仓库模型：集线器有什么用？

我刚刚读到数据仓库建模 https en wikipedia org wiki Data vault modeling据我了解集线器仅包含密钥和记录源所以我想知道为什么我应该创建这些中心表只是为了存储记录源仅拥有卫星和链接还不够吗
创建实时数据仓库

我正在做一个个人项目其中包括创建数据仓库 DWH 的完整架构在本例中作为 ETL 和 BI 分析工具我决定使用 Pentaho 它具有许多功能从允许轻松创建仪表板到完整的数据挖掘流程和 OLAP 多维数据集我读过数据仓库必须是关
包含可在源系统中定期更新的信息的事实表

我正在构建一个维度数据仓库并学习如何从仓库中的源系统对各种业务流程进行建模我目前正在将数据仓库中源系统的投标工作投标建模为事实表其中包含以下信息投标金额预计收入销售人员出价状态有效待定拒绝等 etc 问题在于出价
如何创建历史事实表？

我的数据仓库中有一些实体 Person 具有 personId dateFrom dateTo 和其他可以更改的属性例如姓氏出生日期等缓慢变化的维度 Document 文档 ID 编号类型 Address 地址 ID 城市街道房
什么是多维 OLAP CUBE 并给出超过 3 维的多维数据集示例

由于我是 SSAS 的新手一直在阅读有关多维 OLAP 多维数据集的文章并努力理解多维数据集的概念据说虽然术语多维数据集表示三个维度但多维数据集最多可以有 64 个维度你能解释一下这在立方体上怎么可能吗除了 3 Dim 示例
Microsoft Azure 数据仓库和 SqlAlchemy

我正在尝试使用 python 的 sqlalchemy 库连接到 microsoft azure 数据仓库并收到以下错误 pyodbc Error HY000 HY000 Microsoft ODBC SQL Server Driver
SQL Server 中临时表的使用

这是一个悬而未决的问题但我真的很想听听人们的意见我很少使用显式声明的临时表表变量或常规 tmp 表因为我相信不这样做会导致更简洁可读和可调试的 T SQL 我还认为在需要时例如当您在查询中使用派生表时 SQL 可以比我更好地利
当所有维度值都具有 100% 重要性时处理多对多维度

我至少会尽力保持简洁假设我们正在跟踪一段时间内的账户余额所以我们的事实表将包含诸如账户余额情况表 FK 账户ID FK 日期ID Balance 显然你有一个账户维度表 and a 日期维度表所以现在我们可以轻松地过滤帐户或日期或

随机推荐

Spark 从 DataFrame 中删除重复行 [duplicate]

这个问题在这里已经有答案了假设我有一个像这样的 DataFrame val json sc parallelize Seq a 1 b 2 c 22 d 34 a 3 b 9 c 22 d 12 a 1 b 4 c 23 d 12 val
当调试符号被分割成 dwo dwarf 文件时，gdb 找不到符号

我想构建一个二进制文件g 并将调试信息分割到一个单独的文件中所谓的DebugFission 假设您位于一个文件夹中有一个文件src main cpp内容琐碎 int main 我想使用编译它 gsplit dwarf mkdir p o
“使用命名空间 std”有什么用？ [复制]

这个问题在这里已经有答案了有什么用using namespace std 我希望看到外行术语的解释 using 你会用它名称空间用什么一个命名空间 std The std命名空间 C 标准库的功能例如string or vecto
在 Web 应用程序机器人和功能机器人之间进行选择 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案根据本文在 Azure 机器人服务中创建机器人时您有两种托管选项 https learn microsoft com en us bot f
反应电话号码输入格式和无格式输出

我正在尝试在输入中创建电话号码格式并且其下方的输出中没有电话号码格式我还想添加一个条件如果用户输入超过 10 个条目则输入中将不再有电话格式另外请告诉我是否有任何方法可以在没有react number format 库的情况下执
ReactNative：将 JS 变量传递给 AppDelegate

正如标题中的那样我已经通过变量作为参数传递给本机模块RCT EXPORT MODULE 我知道RCT CUSTOM VIEW PROPERTY 虽然这是用于可调用组件但我不确定它是否可以用于将 JS 变量传递给AppDelegate
在oracle for循环中动态传递表名

是否可以在oracle for循环中动态传递表名 e g for nm in select from table name loop dbms output put line chetan end loop 您可以使用 REF CURSOR
这个任务正确吗？ [复制]

这个问题在这里已经有答案了在一些js库中我发现了这个代码片段 var start end sel scrollPos subst start end scrollPos sel getSelection 在我看来这不是有效的分配但代码
如何找出实际安装的 Bower 软件包的版本？

通常是一个bower json文件指定了一些依赖项但这些依赖项通常被表达为允许使用一系列版本的 Bower 包例如 gt 1 0 这意味着高于 1 0 版本的任何版本我有一个自动化流程需要查找 Bower 包的版本实际安装现在就在这
如何使 Flexbox 列具有相同的高度？

我正试图将我的头围绕在弹性盒上但我却因为一些非常简单的事情而碰壁我似乎无法做到正确我有 6 列我希望它们的高度相同每行 3 列我已将 Flex 项目的宽度设置为 33 但没有设置任何内容的高度我认为一旦弹性项目有了内容它就会
在 UITableViewController 中显示带有滚动的 Toast 消息

对于 Toast 消息我在 swift 5 Xcode 11 中使用 Toast Swift 从 Toast Swift https github com scalessec Toast Swift 但是我对 UITableViewCon
如何在 Vim 中将分割窗口转换为选项卡，反之亦然

例如我使用 3 个分割窗口来打开 3 个不同的文件 window 1 window 3
openCV：创建特征匹配，输出数组的含义，java

下面的代码写在Java using openCV 库图像处理产生类的输出匹配矩阵问题是我不明白数组中的值告诉我有关匹配的信息 FeatureDetector fastFeatureDetector FeatureDetector cr
Linq就是这个string.Compare在查询中效率低下，有没有更好的方法？

本来我有这个方法 public virtual User GetUser string username return db Users Single x gt x UserName username 基本上是一个 linq 方法它根据用
如何使用keras加载图像并显示图像？

matplotlib inline from keras preprocessing import image import matplotlib pyplot as plt import numpy as np img np random
在 OpenShift 上重新启动 WildFly 时出现内存不足错误

我在 OpenShift 上使用 WildFly AS 时遇到问题当我尝试在服务器上部署 WAR 时我不断收到以下异常 2014 12 20 04 31 33 072 INFO org jboss as connector deploy
Durandaljs 可以做区域吗

我正在尝试查看是否有办法在 Durandaljs 中进行区域操作类似的东西 App areas home views viewmodels other views viewmodels 我看到 viewLocator 允许这种约定 vie
在特定 FireStore 集合中执行集合组查询

我的数据库结构如下为了解决这个问题而进行了简化 Collection item A gt Document params someParameter value gt Document user 01 gt Sub collection
CSS 中的 E:dir(dir) 和 E[dir="dir"] 有什么区别？ [复制]

这个问题在这里已经有答案了 W3C 在选择器 4 中引入了一个新的用于方向检测的伪类我想知道它与普通属性选择器有什么区别 CSS2 属性选择器 E dir rtl 选择器4 dir 伪类 E dir rtl 为此创建一个新的伪类有什么具体
数据仓库 - 星型模式与扁平表

我正在尝试为财务系统项目调度系统和无数科学系统等常用数据的单一存储设计一个数据仓库 IE 许多不同的数据集市我一直在阅读数据仓库和流行的方法例如星型模式和 Kimball 方法等但我找不到答案的一个问题是为什么将 DW 数据集市设

数据仓库 - 星型模式与扁平表

数据仓库 - 星型模式与扁平表 的相关文章

随机推荐

热门标签

数据仓库 - 星型模式与扁平表的相关文章