我的 SQL Server 中有一个表,我在其中“暂存”来自 ERP 系统的数据仓库提取内容。
从这个暂存表(表名:DBO.DWUSD_LIVE) ,我构建维度并加载事实数据。
示例 DIMENSION 表称为“SHIPTO”,该维度具有以下列:
"shipto_id
"shipto"
"salpha"
"ssalpha"
"shipto address"
"shipto name"
"shipto city"
现在我有一个 SSIS 包,它在上述列中执行 SELECT DISTINCT 来检索“唯一”数据,然后通过 SSIS 包我分配“shipto_id”代理键。
我当前的 TSQL 查询的一个示例是:
SELECT DISTINCT
"shipto", "salpha", "ssalpha", "shipto address", "shipto name", "shipto city"
FROM DBO.DWUSD_LIVE
这很有效,但不是“快速”,某些维度有 10 列,对这些维度进行不同的选择并不理想。
在这个维度中,我的“业务关键”栏目是“运送至”、“SULFA”和“SULFA”.
所以如果我这样做:
SELECT DISTINCT
"shipto", "salpha", "ssalpha"
FROM DBO.DWUSD_LIVE
它产生与以下相同的结果:
SELECT DISTINCT
"shipto", "salpha", "ssalpha", "shipto address", "shipto name", "shipto city"
FROM DBO.DWUSD_LIVE
有没有更好的方法来执行此 SQL 查询?我需要所有列,但只需要业务关键列上的 DISTINCT。
感谢您的帮助。
下面是我的项目如何在 SSIS 中设置的图像,维度是 SCD 1。