SQL Server：合并性能

2023-12-06

我有一个包含 500 万行的数据库表。聚集索引是自增标识列。还有PK是生成256字节的代码VARCHAR这是 URL 的 SHA256 哈希值，这是表上的非聚集索引。

表格如下：

CREATE TABLE [dbo].[store_image](
    [imageSHAID] [nvarchar](256) NOT NULL,
    [imageGUID] [uniqueidentifier] NOT NULL,
    [imageURL] [nvarchar](2000) NOT NULL,
    [showCount] [bigint] NOT NULL,
    [imageURLIndex]  AS (CONVERT([nvarchar](450),[imageURL],(0))),
    [autoIncID] [bigint] IDENTITY(1,1) NOT NULL,
 CONSTRAINT [PK_imageSHAID] PRIMARY KEY NONCLUSTERED 
(
    [imageSHAID] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON) ON [PRIMARY]
) ON [PRIMARY]

GO

CREATE CLUSTERED INDEX [autoIncPK] ON [dbo].[store_image] 
(
    [autoIncID] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON) ON [PRIMARY]
GO

imageSHAID是图像 URL 的 SHA256 哈希值，例如”http://blah.com/image1.jpg"，它被散列成 256 长度的 varchar。
imageGUID是一个代码生成的 guid，我在其中标识图像（稍后将用作索引，但现在我省略了此列作为索引）
imageURL是图像的完整 URL（最多 2000 个字符）
showCount是图像显示的次数，每次显示该特定图像时都会递增。
imageURLIndex是一个限制为 450 个字符的计算列，这允许我在 imageURL 上进行文本搜索（如果我选择的话），它是可索引的（为了简洁起见，再次省略了索引）
autoIncID是聚集索引，应该允许更快地插入数据。

我定期从临时表合并到store_image桌子。临时表结构如下（与store_image表非常相似）：

CREATE TABLE [dbo].[store_image_temp](
    [imageSHAID] [nvarchar](256) NULL,
    [imageURL] [nvarchar](2000) NULL,
    [showCount] [bigint] NULL,
) ON [PRIMARY]

GO

当合并过程运行时，我写了一个DataTable使用以下代码到临时表：

using (SqlBulkCopy bulk = new SqlBulkCopy(storeConn, SqlBulkCopyOptions.KeepIdentity | SqlBulkCopyOptions.KeepNulls, null))
{
    bulk.DestinationTableName = "[dbo].[store_image_temp]";
    bulk.WriteToServer(imageTableUpsetDataTable);
}

然后我运行合并命令来更新showCount in the store_image表通过基于临时表合并imageSHAID。如果图像当前不存在于store_image表，我创建它：

merge into store_image as Target using [dbo].[store_image_temp] as Source
on Target.imageSHAID=Source.imageSHAID 
when matched then update set 
Target.showCount=Target.showCount+Source.showCount 
when not matched then insert values (Source.imageSHAID,NEWID(), Source.imageURL, Source.showCount);

我通常尝试将临时表中的 2k-5k 行合并到store_image任何一个合并过程中的表。

我曾经在 SSD 上运行此数据库（仅连接 SATA 1），速度非常快（低于 200 毫秒）。我的 SSD 空间不足，因此我将 DB 更换为 1TB 7200 缓存旋转磁盘，此后完成时间超过 6-100 秒（6000 - 100000MS）。当批量插入运行时，我可以看到磁盘活动约为 1MB-2MB/秒，CPU 使用率较低。

这是这种数据量的典型写入时间吗？我觉得有点慢，是什么导致性能缓慢？肯定与imageSHAID被索引后，我们应该期望比这更快的寻道时间？

任何帮助，将不胜感激。

谢谢你的时间。

Your UPDATE中的条款MERGE更新showCount。这需要对聚集索引进行键查找。

然而，聚集索引也被声明为非唯一的。即使基础列是唯一的，这也会向优化器提供信息。

所以，我会做出这些改变

聚集主键为autoIncID
目前的PKimageSHAID成为独立的唯一索引（非约束）并添加 INCLUDEshowCount。唯一约束不能包含 INCLUDE

更多观察：

你不需要nvarchar对于哈希或 URL 列。这些不是 unicode。
哈希值也是固定长度的，因此可以char(64)（对于 SHA2-512）。
列的长度定义分配给查询的内存量。请参阅此了解更多信息：varchar(500) 比 varchar(8000) 有优势吗？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

sqlserver

MERGE

sqlperformance

SQL Server：合并性能的相关文章

如何授予所有表的 REFERENCES 权限

我必须授予REFERENCES登录权限说sql login 我可以给予资助REFERENCES对单个表的权限例如 GRANT REFERENCES ON Mytable TO sql login 有什么办法可以授予REFERENCES允许
将大量实体插入 SQL Server 2012 [重复]

这个问题在这里已经有答案了我正在进行一个使用 Entity Framework 5 和 SQL Server 2012 的项目我们需要一次插入大量行 100k 个实体的顺序基本上我们有一个物理程序它输出大量二进制数据然后我们需要
限制 SQL Server 连接到特定 IP 地址

我想将 SQL Server 实例的连接限制为特定 IP 地址我想阻止来自除特定列表之外的任何 IP 地址的任何连接这是可以在 SQL Server 实例或数据库中配置的东西吗听起来像是你会使用Windows防火墙 http tech
如何在 sqlalchemy 中创建基于文字的查询？

我创建了一个函数来创建表达式 def test operator1 operation operator2 return literal column operator1 op operation operator2 现在当我用 test
PDO SQLSRV 和 PDO MySQL 在获取 int 或 float 时返回字符串

当您获取时 PDO MS SQL Server 和 PDO MySQL 都会返回一个字符串数组即使列的 SQL 类型本应是数字类型例如 int 或 float 我设法解决了这个问题但我想了解为什么它们一开始就这样设计是不是因为PDO
使用Powershell访问远程Oracle数据库

我需要能够连接到我的网络上基于 Windows 7 的 Oracle 服务器 32 位 Oracle XE 我需要连接的机器运行 Windows 7 64 位两台机器上都安装了 Powershell 我已在 64 位计算机上安装了 Ora
如何使用 MySQL 的 LOAD DATA LOCAL INFILE 在导入 CSV 时将字符串日期更改为 MySQL 日期格式

我正在使用 MySQL 的 LOAD DATA LOCAL INFILE SQL 语句将数据从 CSV 文件加载到现有数据库表中下面是一个 SQL 语句示例 LOAD DATA LOCAL INFILE file csv INTO TAB
neo4j cypher更新现有节点或创建新节点

我有一个包含大约 900 万个节点和 1200 万个关系的图对于图中的每个节点每个节点都有一个属性子集这些属性通过标签形成节点的唯一标识该图正在通过各种数据源进行更新这些数据源会增加图中的现有节点或者在节点不存在时创建新节点我
如何在Oracle中使用Timestamp_to_scn和Scn_to_timestamp？

我的查询结果是这样的 select cast to date a start time mm dd yyyy hh mi ss pm as timestamp date of call ora rowscn from calling tab
复选框上的数据绑定

我目前正在将数据从 SQL 数据库之一提取到我的应用程序中我可以让它适用于我的文本框和其他项目但是我似乎无法让它适用于复选框这是我正在使用的代码 DataTable dt new DataTable dt using SqlConn
拆分列中的字符串并在列中添加值

我有一个包含几行数据的表如下所示 16 W 2 Work ALBO 00 Proposal ALxO Amendement 1 20091022 signed pdf 17 W 2 Work ALBO 00 Proposal Level1
将 UUID 存储为 base64 字符串

我一直在尝试使用 UUID 作为数据库键我希望占用尽可能少的字节数同时仍然保持 UUID 表示形式的可读性我认为我已经使用 base64 将其减少到 22 个字节并删除了一些尾随的这些对于我的目的来说似乎没有必要存储这种方法有
gitlab 请求将分支 A 合并到开发中（落后 3 次提交）我应该担心吗？

在 gitlab 中创建合并请求时我经常收到一条消息请求将分支 A 合并到开发中 x 提交落后 gitlab想告诉我什么我应该担心还是需要修复某些东西什么一段时间后合并请求在项目中打开时由于其他人合并了自己的更改您尝试合并到的
在一个数据访问层中处理多个连接字符串

我有一个有趣的困境我目前有一个数据访问层它必须与多个域一起使用并且每个域都有多个数据库存储库具体取决于所调用的存储过程目前我只需使用 SWITCH 语句来确定应用程序正在运行的计算机并从 Web config 返回适当的连接字
sql server 按组排名

问题看似简单但我却无法理解这是针对 sql 服务器的 what I have in a table What I need as a output cksum id cksum id 2162514679 204 2162514679
是否有适用于所有数据库的标准sql

如下所示不同数据库的语法有所不同是否存在适用于所有数据库的标准方法有没有什么工具可以将任意sql转换为任意sql SQL Server 2005 CREATE TABLE Table01 Field01 int primary key
git Blame：合并后正确的作者

GIT 合并引入了新的提交这会导致 git Blame 问题合并的行似乎是由进行合并的开发人员提交的我可以理解这种情况冲突的变化因为他解决了冲突但是有没有办法让非冲突线路不发生这种情况呢一些 git Blame 的选择如果没有
有没有办法以编程方式轻松更改多个 SSIS 包上的服务器名称？

作为发布周期的一部分我们正在创建多个 SSIS 包来迁移大型数据库我们最终可能会得到大约 5 10 个 SSIS 包由于我们有 4 个环境开发 QA 登台生产等是否有一种有效的方法可以在每个 SSIS 包经历不同的服务器环境时更
了解 SSMS 2008 中关系的更新和删除规则

当我们定义外键约束时我对 SQL Server 2008 Management Studio 中的更新和删除规则的含义感到困惑我也没有找到相关的帮助文档例如F1帮助这是屏幕快照如果有人能描述它们的含义并推荐一些相关文档来阅读我将
C# 动态/expando 对象的深度/嵌套/递归合并

我需要在 C 中合并 2 个动态对象我在 stackexchange 上找到的所有内容仅涵盖非递归合并但我正在寻找能够进行递归或深度合并的东西非常类似于jQuery 的 extend obj1 obj2 http api jquer

随机推荐

git push --force，在幕后

当你使用 force 进行 git push 时到底会发生什么我已经在网上搜索了大约一个小时我能找到的最相关的答案是 Same as git push but force the push even if it results in a
如何将列表项从字符串转换为整数？

我有一个字符串列表列表如下所示l 1 2 3 4 5 6 2 3 2 3 4 我想从第 2 项开始将列表视为 int 以下代码实现了目的但没有将列表项转换为 int gt gt gt l i 2 for i in range len l
在管理中列出过滤器和搜索结果

在我覆盖之后get search results方法 list filter不起作用但搜索字段按我的预期工作 class NaruceniProduktiAdmin admin ModelAdmin search fields broj
使用 Eloquent/Raw Laravel 查询的 Group Concat

我有一个以 Eloquent 形式存储的对象结构 item id 2 item color Black item size L item Quantity 5 item id 2 item color Black item size M i
为什么将列表转换为集合比将生成器转换为集合更快？

这是一个例子 gt gt gt from timeit import timeit gt gt gt print timeit y for y in range 100 number 100000 0 7025867114395824 gt
简单的素数程序 - 线程 C# 的奇怪问题

这是我的代码 using System using System Collections Generic using System Linq using System Text using System Threading namespac
删除工作表/图表事件 VBA

我试图在删除工作表 Excel 时触发宏自 2010 年以来出现了不同的删除事件应用程序级别 Application SheetBeforeDelete 事件工作簿级别 Workbook SheetBeforeDelete 事件工
在Shiny R中，有没有办法在observeEvent之后立即运行observeEvent而没有延迟（renderUI的问题）？

好吧我的标题有点令人困惑但让我解释一下我正在使用 renderUI 来获取音频标签但是我想以较低的音量启动音频因为它太大声了下面的代码工作正常除了因为我添加了延迟它以较高的音量开始然后迅速转到较低的音量但它仍然非常明显
世博会开发者菜单未显示

我正在使用 expo 工具并进行原生反应没有任何问题但在我的模拟器上升级 Expo Go 应用程序后出现了问题开发者菜单不会像以前那样显示并且菜单中的项目不会显示我的expo go版本 2 25 1 我正在使用 Genymoti
张量流成本函数是张量，而不是标量 - 为什么？优化失败

以下代码可以运行但不起作用变量cost总是一个充满 1 0 的张量但为什么呢我估计了一个标量因为 1x5 矩阵乘以 5x1 矩阵就是一个标量优化时偏差和权重也不会改变我究竟做错了什么 KI Model x tf placeho
luasocket的问题

我试图从 lua 套接字读取一些二进制数据但上面的代码不会终止重复循环我如何知道流已到达末尾 client require socket client socket connect www google com 80 client
将（自定义）解码器添加到 WebMVC 端点

我有一个 WebMVC 端点 RequestMapping path execution id method RequestMethod POST public ResponseEntity lt gt execute PathVariab
Android socket.io 在不丢失连接的情况下切换活动

我开发了一个游戏它将使用socket io连接我的服务器是用node js编写的我的android客户端使用socket io 现在我的问题是我如何在不失去与服务器连接的情况下切换活动我至少有 4 个活动聊天游戏视图在线玩
Cordova ios 上的 Ajax 调用 SecurityError: DOM Exception 18

您好我正在通过 Cordova 5 1 1 Phonegap 构建 iOS 应用程序但有一个无法解决的问题 A basic Ajax调用抛出一个SecurityError DOM Exception 18我尝试了有关白名单的所有技巧但
MySQL：如何对 ORDER BY 子句使用 CASE

我有一个存储过程必须在根据输入过滤行后返回一个表其中两个输入是sort column and sort dir 查询必须 ORDER BYsort column in the sort dir方向 ASC 或 DESC 我尝试过以下查询
在 Mac 上的 SwiftUI 中处理“打开方式”中的多个 URL

在 SwiftUI 中我们被赋予了onOpenURL 执行功能但是在 macOS 中我们可以在 Finder 中选择多个文件然后单击打开方式如果我使用带有以下代码的应用程序打开这些文件 main struct testURL
康威的生命游戏更新（下一代）

我正在研究 Conway 的生命游戏 java 代码并且我正在与我的更新方法也称为下一代创建者作斗争我将发布我迄今为止编写的代码请让我知道我可以做什么来修复更新方法如果在 T 时刻没有细胞就会诞生一个细胞 1 并且它的三个邻居
EnableRaisingEvents 是否可以在应用程序启动时已在运行的进程上使用？

目前我有一个程序启动另一个应用程序并监视该应用程序以使用以下代码保持其运行 System Diagnostics Process startProgram System Diagnostics Process Start program e
C++：在构造函数中初始化变量的位置[重复]

这个问题在这里已经有答案了可能的重复 C 初始化列表选项 1 与选项 2 初始化变量的优缺点是什么 class MyClass public MyClass float f char a private float mFloat cha
SQL Server：合并性能

我有一个包含 500 万行的数据库表聚集索引是自增标识列还有PK是生成256字节的代码VARCHAR这是 URL 的 SHA256 哈希值这是表上的非聚集索引表格如下 CREATE TABLE dbo store image ima

SQL Server：合并性能

SQL Server：合并性能 的相关文章

随机推荐

热门标签

SQL Server：合并性能的相关文章