T-SQL 中的随机加权选择

2024-04-14

如何根据所有候选行的应用权重在 T-SQL 中随机选择表行？

例如，我在表中有一组行的权重分别为 50、25 和 25（加起来为 100，但不是必须的），我想随机选择其中一个，其统计结果相当于相应的行重量。

Dane 的答案包括以引入平方律的方式进行自连接。(n*n/2)表中有 n 行的连接后的行。

更理想的是能够只解析一次表。

DECLARE @id int, @weight_sum int, @weight_point int
DECLARE @table TABLE (id int, weight int)

INSERT INTO @table(id, weight) VALUES(1, 50)
INSERT INTO @table(id, weight) VALUES(2, 25)
INSERT INTO @table(id, weight) VALUES(3, 25)

SELECT @weight_sum = SUM(weight)
FROM @table

SELECT @weight_point = FLOOR(((@weight_sum - 1) * RAND() + 1))

SELECT
    @id = CASE WHEN @weight_point < 0 THEN @id ELSE [table].id END,
    @weight_point = @weight_point - [table].weight
FROM
    @table [table]
ORDER BY
    [table].Weight DESC

这将遍历表格，设置@id到每条记录的id值同时递减@weight观点。最终，@weight_point将会变为负值。这意味着SUM所有先前权重的总和大于随机选择的目标值。这是我们想要的记录，所以从那时起我们就设定了@id到其自身（忽略表中的任何 ID）。

这仅运行一次表，但即使所选值是第一条记录，也必须运行整个表。因为平均位置是表格的一半（如果按权重升序排序则更少），所以编写循环可能会更快......（特别是如果权重位于公共组中）：

DECLARE @id int, @weight_sum int, @weight_point int, @next_weight int, @row_count int
DECLARE @table TABLE (id int, weight int)

INSERT INTO @table(id, weight) VALUES(1, 50)
INSERT INTO @table(id, weight) VALUES(2, 25)
INSERT INTO @table(id, weight) VALUES(3, 25)

SELECT @weight_sum = SUM(weight)
FROM @table

SELECT @weight_point = ROUND(((@weight_sum - 1) * RAND() + 1), 0)

SELECT @next_weight = MAX(weight) FROM @table
SELECT @row_count   = COUNT(*)    FROM @table WHERE weight = @next_weight
SET @weight_point = @weight_point - (@next_weight * @row_count)

WHILE (@weight_point > 0)
BEGIN
    SELECT @next_weight = MAX(weight) FROM @table WHERE weight < @next_weight
    SELECT @row_count   = COUNT(*)    FROM @table WHERE weight = @next_weight
    SET @weight_point = @weight_point - (@next_weight * @row_count)
END

-- # Once the @weight_point is less than 0, we know that the randomly chosen record
-- # is in the group of records WHERE [table].weight = @next_weight

SELECT @row_count = FLOOR(((@row_count - 1) * RAND() + 1))

SELECT
    @id = CASE WHEN @row_count < 0 THEN @id ELSE [table].id END,
    @row_count = @row_count - 1
FROM
    @table [table]
WHERE
    [table].weight = @next_weight
ORDER BY
    [table].Weight DESC

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sqlserver

TSQL

Random

T-SQL 中的随机加权选择的相关文章

Docker连接SQL Server容器非零代码：1

我正在尝试从创建一个 SQL Server 容器docker compose yml但是当我运行它时它直接停止并出现一些错误注意它运行在带有 docker Preview 的 Apple M1 芯片上 docker compose y
Id 或 [TableName]Id 作为主键/实体标识符

是否首选使用 Id 作为主键的列名或 TableName Id 作为命名约定表账户主键 ID 相对表账户主键 AccountId 在我见过的实现中它似乎分为 50 50 左右每种方法的优点和缺点是什么跟进在我的数据库中使用一
无法在 SSIS 2012 上使用敏感项目参数

在 SSIS 2012 中我尝试对 Oracle 的 OLEDB 连接使用敏感项目参数它与 Sensitive 属性设置为完美配合FALSE 在项目参数设计器中但我不希望密码像那样可见一旦我将敏感属性设置为TRUE并尝试执行我的包
将大量实体插入 SQL Server 2012 [重复]

这个问题在这里已经有答案了我正在进行一个使用 Entity Framework 5 和 SQL Server 2012 的项目我们需要一次插入大量行 100k 个实体的顺序基本上我们有一个物理程序它输出大量二进制数据然后我们需要
限制 SQL Server 连接到特定 IP 地址

我想将 SQL Server 实例的连接限制为特定 IP 地址我想阻止来自除特定列表之外的任何 IP 地址的任何连接这是可以在 SQL Server 实例或数据库中配置的东西吗听起来像是你会使用Windows防火墙 http tech
如何使用 DateTime 执行 SQL NOT NULL？

一个人如何处理DateTime with a NOT NULL 我想做这样的事情 SELECT FROM someTable WHERE thisDateTime IS NOT NULL But how 嗯它有效吗我刚刚测试过 Obje
SQL Server，插入 Excel“链接服务器”时出现“无效列名”错误

我有一个简单的 Excel 电子表格文档运行 Office 2013 我使用 Microsoft Office 15 0 Access 数据库引擎 OLE DB 提供程序将其用作数据库我可以使用 MS SQL Server Manag
Kerberos 双跳

我们遇到了臭名昭著的 Kerberos 双跳问题这是一个全新的域是从以前使用模拟和委派的另一个提供商迁移而来的我们已将操作系统升级到最新的 SQL 服务器 2017 WPF 应用程序使用域凭据 gt Web 服务 IIS 10 上的
suhosin.mt_srand.ignore 在 PHP 中一致洗牌数组的解决方法？

我有一个 PHP 脚本需要随机化一个具有一致结果的数组这样它就可以向用户呈现前几个项目然后如果他们愿意他们可以从同一个打乱的集合中提取更多结果我目前使用的是这个基于我相信的 Fisher Yates 算法 function sh
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql
Amazon RDS for SQL Server 是否支持 SSIS？

从谷歌搜索中读到一些相互矛盾的答案不确定答案是是否还是可能我觉得读的时候已经很清楚了this http docs aws amazon com AmazonRDS latest UserGuide CHAP SQLServer htm
探查器模板可以迁移到较新版本的 SQL Profiler 吗？

是否可以将 Profiler 模板迁移到较新版本的 SQL Server 就我而言我想将 SQL 2008 模板带到 2012 年我尝试过 1 直接文件复制和 2 导出导入在这两种情况下旧模板都会运行但无法修改修改后会出现以下
单独的逗号分隔值并存储在sql server的表中

我有一个存储过程它将逗号分隔的值作为输入我需要将其分开并需要将其作为单独的行存储在表中令 SP 的输入为 Rule ID ListType ID Values 1 2 319 400 521 8465 2013 我需要将它存储在一个名
实体框架 - SQL Server 2005 - IIS 服务器日期时间问题

我正在使用 MVC3 和实体框架在我的应用程序中我需要通过 EF 调用 SQL Server 2005 中的存储过程来根据以下内容搜索一些数据datetime传递的参数在当地环境中一切似乎都运行良好但是将其托管到 IIS 后我在尝
如何在 SQL Server 存储过程中对用户定义的表类型执行 ForEach？

XX PROCEDURE dbo XXX X dbo IntType readonly AS BEGIN SET NOCOUNT ON how can I foreach X here and do process individually
SQL Server 2014 安装中缺少 SQL Server Integration Services

我正在尝试使用 Integration Services 安装 SQL Server 2014 Here https www microsoft com en US download details aspx id 42299是我以前用工具
可以获取SQL Server中当前执行的存储过程的行号吗？

几年前我在 Sybase Delphi 环境中工作使用 BDE 连接到数据库服务器我们有一个 Delphi 小应用程序给定当前正在执行的存储过程的名称它可以告诉您当前正在执行该存储过程的哪一行这对于调试似乎挂起的存储过程非常有用
SQL 国家字符 (NCHAR) 数据类型的真正用途是什么？

也CHAR CHARACTER and VARCHAR CHARACTER VARYING SQL 提供了NCHAR NATIONAL CHARACTER and NVARCHAR NATIONAL CHARACTER VARYING 类型
Visual Studio 2010 中的数据库设计器

我需要创建一个全新的 Sql Server 2008 数据库并希望使用 Visual Studio 2010 Ultimate 中的数据库项目我已经创建了该项目并在下面添加了一个表格dbo架构桌子 sql仅以纯文本形式显示但带有颜色
VB6+SQL-Server：如何使用 ADODB.Command 执行带有命名参数的查询？

我一直在尝试使用 ADODB Command 执行参数化查询我知道我可以使用对于参数但我的查询相当大我真的不想跟踪参数的确切顺序我尝试了类似以下的操作 objCmd CommandType adCmdText objCmd Com

随机推荐

VB.net中是否有像SQL中那样的IN运算符

是否有类似的函数或运算符 If RoleName in Val1 Val2 Val2 Then Go End If 代替 If RoleName Val1 Or RoleName Val2 Or RoleName Val2 Then Go
有人可以解释这种行为吗？只需两行代码[重复]

这个问题在这里已经有答案了请解释一下这个片段 include
Bulbflow：neo4jserver Graph 和 neo4jserver Neo4jclient 之间的区别

我现在正在尝试学习如何连接到 Neo4j 服务器并使用 Python 中的 Bulbflow 在其上运行 Cypher 查询我不明白的是连接到 neo4j 服务器的两种可能性之间的区别 1 Graph http bulbflow com
包含 std::string 常量的类

所以我目前正在使用 C 进行一个学校项目我对此并不熟悉我想创建一个类包含我所有的常量字符串整数双精度自己的类我正在尝试这个这在 Java 中一直对我有用 class Reference Picture Paths publ
使用 TensorFlow 对象检测输出分数、类别和 ID 提取

如何提取由用于对象检测的 Tensorflow 模型生成的图像中检测到的对象对象类别对象 ID 的输出分数我想将所有这些详细信息存储到单独的变量中以便以后将它们存储在数据库中使用与此链接中找到的相同的代码https github
两个日期之间的输出 mysql [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我需要像这样在MYSQL中输出记录
在 mongodb 中创建安全数据库

我想在 mongodb 中创建安全的数据库安全意味着应用程序必须传递用户名密码才能连接到我的 mongodb 数据库来自 Mongo Java 教程 MongoDB 可以在安全模式下运行其中通过名称和密码身份验证控制对数据库的访问
模拟Android AssetManager

我有一段代码接受 Context 并将该上下文传递给私有方法私有方法调用 getAssets open 来读取我的应用程序的资产文件夹中存在的文件 public void methodA Context ctx throws IOExce
将服务器端 MVC 与 Backbone.js 相结合

我将 NET MVC 用于所有服务器端逻辑并提供初始页面但我的应用程序在客户端非常繁重因此我采用了 Backbone JS 事实证明它非常有用但我不确定如何构建我的系统以整合这两种技术在我看来我有两个选择在服务器端从 MVC 中
ios中如何将字节数组转换为图像

今天我的任务是将字节数组转换为图像首先我尝试将图像转换为字节数组为了将图像转换为字节数组我们首先要做的就是转换该特定图像 UIImage to NSData 然后我们将其转换为NSData到字节数组这里我将给出示例代码只需浏览
为什么enable_shared_from_this有一个非虚拟析构函数？

我有一个宠物项目我用它来试验 C 11 的新功能虽然我有使用 C 的经验但我对 C 还很陌生为了训练自己采用最佳实践除了大量阅读之外我启用了一些严格的编译器参数使用 GCC 4 4 1 std c 0x Werror Wall
Twig 中的 {{ exception.message }} 不渲染 HTML

我有这个控制器在哪里 Exception被提出了我还没弄清楚哪个SF2Exception尚未使用在一定条件下就这个
Django - 将参数传递给 CBV 装饰器的正确方法？

文档功能应用装饰器的不错选择例如login required基于类的视图 https docs djangoproject com en dev topics class based views intro decorating the
ANDROID CAMERA：获取参数失败（空参数）

您好我仅在棒棒糖以下的操作系统版本中遇到此问题对此进行了大量搜索但没有找到正确的解决方案我认为问题出在操作系统版本上它在 5 中工作正常我的代码是 private void setCameraPhotoQuality Camer
设置 li 标签内的字体颜色

我的标记如下所示 div class c1 li class c2 a href blah a li div 我希望文字 blah 是红色的 c1 在其他地方使用所以我想在不影响其他标记的情况下尽可能深入在您的 css 文件中使用此样式
C#：绘制自己的条形图

我正在尝试通过绘制一个简单的条形图C 但我从未尝试过 Graphics 和 Drawing 命名空间我想生成一个开始和结束图形然后以某种方式重复图像以显示长度但我不知道如何做到这一点如果您能指出正确的方向和或您有示例代
尽管包含必需的标头，但仍出现“‘sockaddr_in’未声明（在此函数中首次使用）”错误

include
如何将列表转换为可枚举

我的以下代码有问题 public IEnumerable
为什么 php 脚本速度变慢？

我正在编写迁移脚本该脚本从一个 MySQL 数据库中选择数据并通过原则导入到另一个 MySQL 数据库中问题是在创建每个实体块之后我的脚本速度就会变慢导入前 100 篇文章大约需要 5 秒接下来的 100 篇文章需要 7 秒接
T-SQL 中的随机加权选择

如何根据所有候选行的应用权重在 T SQL 中随机选择表行例如我在表中有一组行的权重分别为 50 25 和 25 加起来为 100 但不是必须的我想随机选择其中一个其统计结果相当于相应的行重量 Dane 的答案包括以引入平方律的方式

T-SQL 中的随机加权选择

T-SQL 中的随机加权选择 的相关文章

随机推荐

热门标签

T-SQL 中的随机加权选择的相关文章