UTF-8 支持、SQL Server 2012 和 UTF8String UDT

2023-11-29

针对我的特定应用程序，研究了 SQL Server VARCHAR 与 NVARCHAR 的优缺点，我意识到如果 SQL Server 本身支持 UTF8 将是理想的选择。一些 SO 帖子表明事实并非如此，例如：

VARCHAR 完全像 20 世纪 90 年代吗？

varchar 和 nvarchar SQL Server 数据类型之间的主要性能差异是什么？

然而，后来我在 SQL Server 2012 的 MSDN 文档中发现了这篇文章，其中展示了如何创建 UTF8String 用户定义的数据类型：

http://msdn.microsoft.com/en-us/library/ff877964(v=sql.110).aspx

看起来 UDT 将允许每个字符 8 位的空间（内存、磁盘）优势，同时足够灵活，可以存储可以用 UTF-8 表示的任何字符串。那是对的吗？此策略是否有缺点（例如，为每行执行托管代码的性能成本……）？

通过 SQLCLR 创建自定义用户定义类型是not，以任何方式，将为您提供任何本机类型的替代品。它对于创建处理专门数据的东西非常方便。但字符串，即使是不同的编码，也远非专业化。对字符串数据采用这种方法会破坏系统的任何可用性，更不用说性能，因为您将无法使用any内置字符串函数。

如果您能够节省磁盘空间上的任何内容，那么您所损失的整体性能就会抹去这些收益。存储 UDT 是通过将其序列化为VARBINARY。所以为了做到any字符串比较或排序，除了“二进制”/“序数”比较之外，您必须将所有其他值一一转换回 UTF-8，然后进行可以考虑语言差异的字符串比较。该转换需要在 UDT 内完成。这意味着，与 XML 数据类型一样，您将创建 UDT 来保存特定值，然后公开该 UDT 的方法来接受字符串参数来进行比较（即Utf8String.Compare(alias.field1)或者，如果为该类型定义一个运算符，则Utf8string1 = Utf8string2并拥有=运算符获取UTF-8编码的字符串，然后执行CompareInfo.Compare()).

除了上述注意事项之外，您还需要考虑通过 SQLCLR API 来回传递值会产生成本，尤其是在使用NVARCHAR(MAX) or VARBINARY(MAX)相对于NVARCHAR(1 - 4000) and VARBINARY(1 - 4000)分别（请不要将这种区别混淆为暗示使用SqlChars / SqlBytes vs SqlString / SqlBinary).

最后（至少在使用 UDT 方面），请不要忽视这样一个事实：正在查询的 UDT 是示例代码。唯一提到的测试纯粹是功能性的，没有涉及可扩展性或“使用一年后学到的经验教训”。功能测试代码显示在下面的 CodePlex 页面上，在继续做出此决定之前应该先查看一下，因为它让您了解如何编写查询以便与其交互（这对于字段或字段来说很好）两个，但是not对于大多数/所有字符串字段）：

http://msftengprodsamples.codeplex.com/SourceControl/latest#Kilimanjaro_Trunk/Programmability/CLR/UTF8String/Scripts/Test.sql

考虑到添加的持久计算列和索引的数量，真的节省了空间吗？ ;-)

如果需要考虑空间（磁盘、内存等），您有以下三种选择：

如果您使用的是 SQL Server 2008 或更高版本，并且使用的是企业版，那么您可以启用数据压缩。数据压缩可以（但不会“总是”）压缩 Unicode 数据NCHAR and NVARCHAR字段。决定因素是：
1. NCHAR(1 - 4000) and NVARCHAR(1 - 4000)使用Unicode 标准压缩方案，但仅从 SQL Server 2008 R2 开始，并且仅适用于 IN ROW 数据，不适用于 OVERFLOW！这似乎比常规的 ROW/PAGE 压缩算法更好。
2. NVARCHAR(MAX) and XML（而且我想也VARBINARY(MAX), TEXT, and NTEXT) IN ROW（不在 LOB 或 OVERFLOW 页中的行外）的数据至少可以进行 PAGE 压缩，并且maybe还进行了 ROW 压缩（不确定最后一个）。
3. 任何 OFF ROW 数据、LOB 或 OVERLOW = 不进行压缩！
如果使用 2008 年之前的版本或不是企业版，则可以有两个字段：一VARCHAR和一个NVARCHAR。例如，假设您存储的 URL 大部分都是基本 ASCII 字符（值 0 - 127），因此适合VARCHAR，但有时有 Unicode 字符。您的架构可以包含以下 3 个字段：
```
  ...
  URLa VARCHAR(2048) NULL,
  URLu NVARCHAR(2048) NULL,
  URL AS (ISNULL(CONVERT(NVARCHAR([URLa])), [URLu])),
  CONSTRAINT [CK_TableName_OneUrlMax] CHECK (
                    ([URLa] IS NOT NULL OR [URLu] IS NOT NULL)
                AND ([URLa] IS NULL OR [URLu] IS NULL))
);
```
在这个模型中你only选择从[URL]计算列。对于插入和更新，您可以通过查看转换是否改变传入值来确定要使用哪个字段，该值必须是NVARCHAR type:
```
INSERT INTO TableName (..., URLa, URLu)
VALUES (...,
        IIF (CONVERT(VARCHAR(2048), @URL) = @URL, @URL, NULL),
        IIF (CONVERT(VARCHAR(2048), @URL) <> @URL, NULL, @URL)
       );
```
如果您的字段应该只包含适合扩展 ASCII 字符集的特定代码页的字符，那么只需使用VARCHAR.

附：只是为了清楚起见而说明：新_SCSQL Server 2012 中引入的排序规则仅允许：

正确处理补充字符/代理对的内置函数，以及
用于排序和比较的补充字符的语言规则

但是，即使没有新的_SC排序规则，您仍然可以将任何 Unicode 字符存储到 XML 或N-前缀类型，并在不丢失数据的情况下检索它。但是，当使用较旧的排序规则（即名称中没有版本号）时，所有补充字符彼此相等。您需要使用_90 and _100至少可以进行二进制/代码点比较和排序的排序规则；它们无法考虑语言规则，因为它们没有补充字符的特定映射（因此没有权重或规范化规则）。

请尝试以下操作：

IF (N'


				
						 
                
                    本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)
                     
                
		 

								
				
					
						
												
                            
                                
                                    sqlserver                                
							
                        
												
                            
                                
                                    Unicode                                
							
                        
												
                            
                                
                                    UTF8                                
							
                        
												
                            
                                
                                    SQLServer2012                                
							
                        
												
                            
                                
                                    userdefinedtypes









	
		
				UTF-8 支持、SQL Server 2012 和 UTF8String UDT  的相关文章
		
	
	
				
			
				
					WinForms 应用程序设计 - 将文档从 SQL Server 移动到文件存储				
			
			                       
                    我有一个连接到 SQL Server 的标准 WinForms 应用程序 该应用程序允许用户上传当前存储在数据库中的文档 在使用图像列的表中 我需要更改这种方法 以便将文档存储为文件 并将文件的链接存储在数据库表中 使用当前的方法 当用户上                
                		
				
			
				
					需要 SQL Server 查询帮助				
			
			                       
                    我在视图中存储一堆数据 将 MS Access 查询转换为视图 现在我想做的是编写一个存储过程来根据添加数据的时间提取数据 这是我正在运行的查询 Select Name PlanID ApptDate 1stAppt rn from Sel                
                		
				
			
				
					Docker连接SQL Server容器非零代码：1				
			
			                       
                    我正在尝试从创建一个 SQL Server 容器docker compose yml但是当我运行它时 它直接停止并出现一些错误 注意 它运行在带有 docker Preview 的 Apple M1 芯片上 docker compose y                
                		
				
			
				
					查询所有表数据并进行索引压缩				
			
			                       
                    是否有人碰巧拥有一个通用 SQL 语句 可以列出数据库中每个分区的所有表和索引及其当前的压缩设置 Thanks 编辑 这是我尝试查询表所得到的 但我不确定连接是否正确 我得到了重复项 这似乎是由于索引的存在引起的 SELECT t name                
                		
				
			
				
					Id 或 [TableName]Id 作为主键/实体标识符				
			
			                       
                    是否首选使用 Id 作为主键的列名或 TableName Id 作为命名约定 表 账户主键 ID 相对 表 账户主键 AccountId 在我见过的实现中 它似乎分为 50 50 左右 每种方法的优点和缺点是什么 跟进 在我的数据库中使用一                
                		
				
			
				
					使用 Switch 的报告服务表达式				
			
			                       
                    我无法让这个表达式与报告服务一起使用 我必须使用 IF 和 ELSE IF 语句 感谢您的任何建议 Switch IsNothing Fields field date Value Fields set flag Value 1 Decli                
                		
				
			
				
					将大量实体插入 SQL Server 2012 [重复]				
			
			                       
                    这个问题在这里已经有答案了 我正在进行一个使用 Entity Framework 5 和 SQL Server 2012 的项目 我们需要一次插入大量行 100k 个实体的顺序 基本上 我们有一个物理程序 它输出大量二进制数据 然后我们需要                
                		
				
			
				
					连接两个表的查询的 SQL Server“FOR XML”输出				
			
			                       
                    我是 SQL Server 中 FOR XML 功能的新手 我正在使用 SQL Server 2012 我有两个表 Word 和 Word Expansion 样本数据 表 字 WordOID Word 1 PIPE 2 WIRE 表 Wo                
                		
				
			
				
					SQL Server 用分隔符分割字符串				
			
			                       
                    我有一个输入字符串 100 2 3 101 2 1 103 2 3 我想解析它并将其添加到具有 3 列的表中 因此它应该是 f x col1 col2 col3 100 2 3 类似的其他数据以逗号分隔作为记录和 作为列 Thanks ni                
                		
				
			
				
					Perl 和 Unix 如何以相同的顺序对 Unicode 字符串进行排序？				
			
			                       
                    我正在尝试获取 Perl 和 GNU Linuxsort 1 程序就如何对 Unicode 字符串进行排序达成一致 我在跑sort with LANG en US UTF 8 在Perl程序中我尝试了以下方法 use Unicode Col                
                		
				
			
				
					Kerberos 双跳				
			
			                       
                    我们遇到了臭名昭著的 Kerberos 双跳问题 这是一个全新的域 是从以前使用模拟和委派的另一个提供商迁移而来的 我们已将操作系统升级到最新的 SQL 服务器 2017 WPF 应用程序 使用域凭据 gt Web 服务 IIS 10 上的                
                		
				
			
				
					sql server 按组排名				
			
			                       
                    问题看似简单 但我却无法理解 这是针对 sql 服务器的 what I have in a table What I need as a output cksum id cksum id 2162514679 204 2162514679                 
                		
				
			
				
					对多个数据库执行 SQL 查询				
			
			                       
                    我知道我的帖子与该论坛中的其他帖子的标题非常相似 但我真的找不到我需要的答案 这是我的问题 我的 Windows Server 上运行着 SQL Server 在我的 SQL Server 中 我有大约 30 个数据库 它们都具有相同的表和                
                		
				
			
				
					Spark.read 在 Databricks 中给出 KrbException				
			
			                       
                    我正在尝试从 databricks 笔记本连接到 SQL 数据库 以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql                
                		
				
			
				
					C# 按钮文本 Unicode 字符				
			
			                       
                    C 不想在按钮上放置 Unicode 字符 如果我将 u2129 放入按钮的 文本 属性中 按钮将显示 u2129 而不是 Unicode 字符 例如 我选择 2129 因为我可以在计算机上当前活动的字体中看到它 我之前看到过这个问题链接文                
                		
				
			
				
					如何在 SQL Server 存储过程中对用户定义的表类型执行 ForEach？				
			
			                       
                    XX PROCEDURE dbo XXX X dbo IntType readonly AS BEGIN SET NOCOUNT ON how can I foreach X here and do process individually                
                		
				
			
				
					C#的数组列表可以用来填充SSIS对象变量吗？				
			
			                       
                    我已在 C 脚本中填充了一个列表 并将其值分配给 SSIS 对象变量 然后 我使用该对象变量通过循环遍历 For every do 枚举器来执行一些 SQL 查询 我尝试通过 Foreach ado 枚举器执行此操作 但出现错误 X 变量不                
                		
				
			
				
					临时表是线程安全的吗？				
			
			                       
                    我正在使用 SQL Server 2000 它的许多存储过程广泛使用临时表 数据库的流量很大 我担心创建和删除临时表的线程安全性 假设我有一个存储过程 它创建了一些临时表 它甚至可以将临时表连接到其他临时表等 并且还可以说两个用户同时执行存                
                		
				
			
				
					Android访问远程SQL数据库				
			
			                       
                    我可以直接从 Android 程序访问远程 SQL 数据库 在网络服务器上 吗 即简单地打开包含所有必需参数的连接 然后执行 SQL 查询 这是一个私人程序 不对公众开放 仅在指定的手机上可用 因此我不担心第三方获得数据库访问权限 如果是这                
                		
				
			
				
					如何跨多个表强制执行 CHECK 约束				
			
			                       
                    我有一个在 Microsoft SQL Server 2012 Express 中记录奶牛繁殖信息的数据库 显然 一头牛只有在出生后才能配种 并且在其一生中可能会配种多次 我需要在我的数据库中强制执行这些约束 我目前已经根据下图安排了一个架                
                		
			




 

 



    
        
            随机推荐
        
    
    
                
            
                
                    使用 jquery.event.drag 拖动多个元素                
            
                                   
                    我想用 jQuery 插件拖动多个元素jquery event drag 这里有一个原始演示的小提琴 这是链接原始演示 在演示中 用户单击他想要选择的方块并拖动它们 但我想做一些最简单的事情 只需单击方块 1 并移动所有方块 我尝试了不同的                
                        
                
            
                
                    GGPlot2 中带有子组的森林图                
            
                                   
                    作为 R 的新手 没有任何编码经验 我遇到以下问题 我正在尝试创建比值比的分组森林图 斑点图 横轴应包含 OR 纵轴为变量 每个变量都包含 A 组和 B 组的 OR 包括下限和上限 因此 垂直轴上显示的每个变量应该可见 2 条线 这webs                
                        
                
            
                
                    使用 Carbon 更改日期格式                
            
                                   
                    我正在使用 Laravel 框架并使用 Carbon 包进行日期转换 我无法将日期格式转换为 mysql 格式 我有以下代码 request gt event start date将会有25 08 2017 print r carbon p                
                        
                
            
                
                    jQuery 附加 CSS 文件并等待直到应用样式而不使用 setInterval？                
            
                                   
                    我通过以下方式加载CSS head append 它可以工作 但我有一个需要在应用 CSS 后运行的函数 并且我不想使用setInterval for it 我怎样才能做到这一点 一种解决方案是 如果您有权访问正在加载的 css 文件 是使                
                        
                
            
                
                    如何在 PRE 标记中显示来自 AJAX 请求的 XML 响应                
            
                                   
                    我正在使用 jquery 向 Web 服务发出 AJAX 请求 该请求以 XML 响应 ajax type GET url uri dataType xml async false contentType text xml charset                 
                        
                
            
                
                    C 中的 sys/mmap 未声明 MAP_ANON 和 MAP_ANONYMOUS                
            
                                   
                    这是我的mman h文件包含自 usr include sys http pastebin com FZpHwKMC Somehow mmap 似乎已定义 并且可以与标志 0 和读 写保护一起使用 但没有MAP ANON or MAP AN                
                        
                
            
                
                    访问 Logstash 中的嵌套 JSON 字段                
            
                                   
                    我在访问 Logstash 最新版本 中的嵌套 JSON 字段时遇到问题 我的配置文件如下 input http port gt 5001 codec gt json filter mutate add field gt es index                 
                        
                
            
                
                    Sys.WebForms.PageRequestManagerParserErrorException：无法解析从服务器接收的消息                
            
                                   
                    我的页面上有一个网格视图 我想将其导出到 Excel 工作表 下面是我为执行此任务而编写的代码 这里我已经将数据集传递给绑定网格的方法并btnExcelExport是将网格内容导出到 Excel 工作表的按钮 private void Bi                
                        
                
            
                
                    设置滑块值以设置 AVPlayer 中的 SeekToTime                
            
                                   
                    我在用Player库 即使用 AVPlayer 和 AVFoundation 这对我的情况来说非常方便 我成功地播放了视频并添加了滑块 我将滑块的最小值设置为 0 最大值设置为视频的持续时间 此时 为了将滑块连接到当前播放时间 我使用了这个                
                        
                
            
                
                    对于 inline 和 constexpr 函数，“遵守 ODR”是什么意思？                
            
                                   
                    我刚刚读到 constexpr 和内联函数遵循单一定义规则 但它们的定义必须相同 所以我尝试一下 inline void foo return inline void foo return int main foo 错误 重新定义 void                
                        
                
            
                
                    如何以编程方式/动态地将组件添加到 p:dataTable 方面                
            
                                   
                    我正在尝试为我的添加全局过滤器                
                        
                
            
                
                    bash中stdout和stderr的顺序                
            
                                   
                    ls test mp4 test sh 1 gt tmp text 2 gt 1 cat tmp text ls cannot access test sh No such file or directory test mp4 为什么结果不                
                        
                
            
                
                    采用函数指针的函数模板的干净实现                
            
                                   
                    我已经成功实现并测试了我的函数包装器实现 但是 该界面并不像应有的那么好 template lt typename F F f gt void register function const char name int lf lua Sta                
                        
                
            
                
                    变换上三角矩阵 MATLAB                
            
                                   
                    如果我在 MATLAB 上有一个上三角矩阵 LIKE A 1 2 3 4 0 5 6 7 0 0 8 9 0 0 0 1 您将如何将其转换为 a 1 2 3 4 2 5 6 7 3 6 8 9 4 7 9 1 转置并保留原始上三角值 a A                
                        
                
            
                
                    使用属性路由时查询字符串不起作用                
            
                                   
                    我在用着System Web Http RouteAttribute and System Web Http RoutePrefixAttribute为我的 Web API 2 应用程序启用更清晰的 URL 对于我的大多数请求 我可以使用路                
                        
                
            
                
                    重载 + 运算符以添加 2 个多项式                
            
                                   
                    我正在尝试将存储在二维数组中的两个多项式相加 第一行存储系数 第二行存储阶数 我创建了一个重载 函数 但在这里我使用 2D 分配的内存数组 当调用该函数时它会崩溃 更新 它现在运行 但结果是一些大的负数 仅供参考 我有一个复制构造函数和一个                
                        
                
            
                
                    错误 [ERR_REQUIRE_ESM]：不支持 ES 模块的 require() [重复]                
            
                                   
                    这个问题在这里已经有答案了 我正在尝试做一个Discord机器人只会告诉你是否有人在线玩游戏 然而我不断收到这样的消息 ERR REQUIRE ESM 不支持 ES 模块的 require 相反 将index js in 的 require                
                        
                
            
                
                    如何读取并解析该文本文件的内容？                
            
                                   
                    我想以 C 的方式读取文本文件 这是文本文件中的示例 item name 256 desc 520 Index 1 Image Wea001 specialty aspeed 700 item name 257 desc 520 Index                
                        
                
            
                
                    如何从 YouTube 嵌入中删除暂停时叠加的“更多视频”？ Edpuzzle 和可汗学院以某种方式做到了                
            
                                   
                    我希望在嵌入的 YouTube 视频暂停时不显示 更多视频 叠加层 我看过其他类似的帖子one或这个one 但没有人提到这样一个事实 Edpuzzle 例如https edpuzzle com media 5e96205457b2f23ef                
                        
                
            
                
                    UTF-8 支持、SQL Server 2012 和 UTF8String UDT                
            
                                   
                    针对我的特定应用程序 研究了 SQL Server VARCHAR 与 NVARCHAR 的优缺点 我意识到如果 SQL Server 本身支持 UTF8 将是理想的选择 一些 SO 帖子表明事实并非如此 例如 VARCHAR 完全像 20                
                        
            






    
        
            热门标签
        
    

    
                        
            
                
                    华为OJ中级                
            
        
                        
            
                
                    报错信息记录                
            
        
                                
            
                
                    原因以及解决办法                
            
        
                        
            
                
                    声明式事务失效                
            
        
                                
            
                
                    干涉法测微小量实验                
            
        
                        
            
                
                    NET 35                
            
        
                        
            
                
                    NET 40                
            
        
                                        
            
                
                    druid常见问题                
            
        
                                
            
                
                    AMBA                
            
        
                                
            
                
                    rtsp连接                
            
        
                                
            
                
                    mmsegment                
            
        
                        
            
                
                    干货知识                
            
        
                        
            
                
                    SSH服务器                
            
        
                                        
            
                
                    koasend                
            
        
                        
            
                
                     KOA从0到1                
            
        
                                        
            
                
                    多进程调试                
            
        
                        
            
                
                    信号特征