MySQL：将大表拆分为小表的最快方法

2023-12-01

我有一个非常大的表，其中有近 3 亿条记录。由于 select 查询对我来说太慢了，所以我想将其拆分为大约 800 个小表。

数据集如下所示：

XXXXXX column2 column3 column4 ...
XXXXXX column2 column3 column4 ...
XXXXXX column2 column3 column4 ...
YYYYYY column2 column3 column4 ...
YYYYYY column2 column3 column4 ...

我想根据第一列的值拆分表格（例如记录XXXXXX分成表XXXXXX），最快的制作方法是什么？

注意：我已经为其添加了 10 个分区，但它并没有很好地加快速度。

分区在两种情况下作为性能策略起作用：

该表的主查询最终执行表或索引扫描，并且位于具有足够资源和适当配置以执行高级并行性的系统上。因此，如果所有分区都位于同一个物理驱动器上，那不会给您带来太多好处，您会像最初一样受到 I/O 限制。但是，如果您使用的是 16 核系统，并且每个分区都位于物理上不同的磁盘上，该怎么办？分区可能会显着提高系统性能。
分区规则使用在针对该表的最流行查询中经常使用的索引。如果您想通过该途径提高性能，则应根据经常用于过滤或约束结果集的索引值进行分区。最常见的候选者是交易日期，因为报告通常是按日历日期范围进行的。然后，查询优化器可以使用分区规则将操作限制到单个（较小的）分区，或者并行运行两个或多个分区扫描（遵循上述相同的限制）。

我认为想要拆分此表的主要原因是为了性能。但是800个分区？如果您追求的是性能改进，那么这可能是错误的方法。企业数据库在高速缓存中保留尽可能多的顶级表索引以获得良好的性能。在五层 b 树中，对于一个中等使用的表，在第一次访问后，前三层很可能始终保留在缓存中（这对于具有整数主键的 300M 行表来说可能是这样的配置）。通过将表分成 800 个部分，这意味着将尝试缓存 800 个数据结构（除了表数据本身）。如果您的访问或多或少是按主键均匀分布的，那么在一个分区上进行搜索最终可能会推送其他分区out缓存，最终损害整体性能。

然而，如果您决定这样做，将表分区为 N 个部分的最简单方法是根据您想要的分区数对主键的模数进行分区（primary_key % 800，在你的情况下）。较新版本的 MySQL 还支持散列分区，使得分区成任意数量的集合相当简单：

PARTITION BY HASH(some_column_value) PARTITIONS number_of_partitions

如果您想将数据放入 800 个实际表中，则必须使用编辑器魔法，或使用脚本语言，并在 SQL 中执行此操作：

CREATE TABLE table1 LIKE MasterTable
CREATE TABLE table2 LIKE MasterTable
CREATE TABLE table3 LIKE MasterTable
..
INSERT INTO table1 SELECT * FROM MasterTable WHERE id MOD 800 = 0
INSERT INTO table2 SELECT * FROM MasterTable WHERE id MOD 800 = 1
INSERT INTO table3 SELECT * FROM MasterTable WHERE id MOD 800 = 2

您可以使用动态 SQL 在您最喜欢的编程语言中循环执行此操作：这可能是最容易呈现的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mysql

MySQL：将大表拆分为小表的最快方法的相关文章

使用唯一索引删除重复项

我在两个表字段 A B C D 之间插入相信我已经在 A B C D 上创建了唯一索引以防止重复然而我以某种方式简单地对这些做了一个正常的索引因此插入了重复项这是2000万条记录的表如果我将现有索引从普通索引更改为唯一索引或者只
在docker中使用MySQL数据库设置aspnetcore

我正在尝试设置一个 docker compose 文件其中包含 asp net core mysql 数据库和 phpmyadmin 的容器设置我的 mysql 服务器没有问题我可以使用 phpmyadmin 访问它我的 asp n
MySQL+子串怎么做？ + 替换？

我不太擅长 SQL 希望能够变得更好我在尝试执行某些表操作时遇到一些麻烦我希望能够从下面的 ProgUID 列中选择子字符串就像是 SUBSTRING table ProgUID 3 12 这将为我提供 ProgUID P CAMVE
通过连接从两个表中删除？

我有两个表如下 tbl1 tbl2 id article id title image whole news tags author older datetime 其中 tbl1 id gt tbl2 article id 如何从两个表中删
MySQL 全文搜索不适用于某些单词，例如“house”

我已经在 3 个字段中的一小部分记录上设置了全文索引也尝试了 3 个字段的组合并得到了相同的结果有些单词返回结果很好但某些单词如 house 和澳大利亚不这样做有趣的是澳大利亚和家乡这样做这似乎是奇怪的行为如果我添
单行的总和值？

我有一个 MySQL 查询它返回由一系列 1 和 0 组成的单行它用于进度条指示器我现在在代码中对它进行求和但我尝试对查询中的值求和并意识到我无法使用 SUM 因为它们有很多列但只有一行有没有办法可以在查询中自动求和就像这样
ActiveRecord3死锁重试

Rails 3 或 ActiveRecord 3 是否有任何插件可以复制旧版本死锁重试 http agilewebdevelopment com plugins deadlock retry插入或者该插件仍然适用于 Rails 3 吗
MySql 最后插入 ID，连接器 .net

我正在使用 MySql Connector net 我需要获取最后一个查询生成的插入 id 现在我假设返回值是MySqlHelper ExecuteNonQuery应该是最后一个插入id 但它只返回1 我正在使用的代码是 int inse
使 pdo::query 静态

当我运行下面的代码时出现此错误我通常使用 msql 函数但我尝试使用 PDO 代替怎么了致命错误第 14 行无法静态调用非静态方法 PDO query
如何使用 MySQL 的 LOAD DATA LOCAL INFILE 在导入 CSV 时将字符串日期更改为 MySQL 日期格式

我正在使用 MySQL 的 LOAD DATA LOCAL INFILE SQL 语句将数据从 CSV 文件加载到现有数据库表中下面是一个 SQL 语句示例 LOAD DATA LOCAL INFILE file csv INTO TAB
如何在 Laravel 查询中使用多个 OR,AND 条件

我需要 Laravel 查询帮助我的自定义查询返回正确结果 Select FROM events WHERE status 0 AND type public or type private 如何写这个查询Laravel Event w
Mysql 中 UNION 子句的替代方案

我有两张桌子表 a 表 b table a ID 1 2 3 4 5 7 table b ID 2 3 4 5 6 我必须得到这样的输出而无需UNION命令 ID 1 2 3 4 5 6 7 注意我有一个联合解决方案 select fr
Mysql 创建定义器

我创建了一个在 CentOS Web 服务器上运行的 Intranet Web 应用程序该应用程序使用另一个本地服务器始终是 CentOS 作为 MySQL 数据库在数据库内部我创建了例程这些例程总是这样开始 CREATE DEFI
将第三个表链接到多对多关联中的桥接表

设计这个数据库的正确方法是什么这是我设置表格的方式我在名为教师的表和名为仪器的表之间存在多对多关系然后我有一个连接两者的桥接表我想将另一个表与 BRIDGE 表关联起来意思是乐器老师的组合该表有 3 行指定老师可以教
如何使用 vitess 仅对特定表进行分片

我创建了一个包含三个表的未分片键空间现在我想对前两个表的键空间进行分片但不想对第三个表进行分片如何才能做到这一点 Vitess 文档不包含任何与此相关的信息或示例请帮忙 Thanks vitess 中的垂直分片与水平分片类似您应该
比特纳米。重置mysql根密码

我如何重置 MySQL 中的 root 密码和帐户因为我按照如何为其他服务器授予权限的说明操作并且意外地将 root 用户 Mysql 绑定到其他 IP 地址现在看来我无法在 localhost 上以管理员身份登录 Thanks 您有
gem install mysql：无法构建 gem 本机扩展 (Mac Lion)

我为 Mac OS X Lion 安装了 MySQL 5 5 27 来自 dmg 现在我尝试安装 mysql gem gem install mysql Building native extensions This could take
如何从shell脚本自动登录MySQL？

我有一个 MySQL 服务器其中有一个用户和密码我想在 shell 脚本中执行一些 SQL 查询而不指定密码如下所示 config sh MYSQL ROOT root MYSQL PASS password mysql sh sou
我可以使用 HSQLDB 进行 junit 测试克隆 mySQL 数据库吗

我正在开发一个 spring webflow 项目我想我可以使用 HSQLDB 而不是 mysql 进行 junit 测试吗如何将我的 mysql 数据库克隆到 HSQLDB 如果您使用 spring 3 1 或更高版本您可以使用 s
SQL不允许表中有重复记录

如何使其不添加重复项我想让它通过 ID 之外的所有其他列进行检查我希望这个无效 ID col1 col2 col3 1 first middle last ID col1 col2 col3 2 first middle last 我希

随机推荐

对于程序的不同运行，全局变量的地址是否相同？

考虑以下代码片段 int i 10 int main cout lt lt i 一旦为程序生成了 exe 程序不同运行的输出是否相同假设操作系统支持虚拟内存编辑这个问题特定于存储在数据段中的全局变量由于这是第一个全局变量因此地址应
JS下载多个文件

我的目标是有一个脚本来下载给定数组内的所有文件 var links http file examples com wp content uploads 2017 10 file example JPG 100kB jpg http file
从 Android Activity 类调用 Javascript 函数

我正在开发需要使用参数调用 Javascript 函数的应用程序为了演示我在这里写了我的 Activity 代码我想从中调用 js 函数主要活动 WebView wView FloatingActionButton fab Cont
按键将对象分组为二维数组

我有一系列对象这些对象有一个属性称为time 如果这些对象的时间相同我想将它们分组到同一个数组中 00 00 id 1 time 00 05 id 1 time 00 15 id 1 time 00 20 id 2 time 00 05
批量复制特定文件到子文件夹中

我有一个 Windows 批处理文件正在运行该文件以将特定文件移动到子文件夹中 ECHO OFF ECHO Start Copy setlocal enabledelayedexpansion set SOURCE DIR C Users
将数组插入 PHP 文件

这可能非常愚蠢但我们还无法做到这一点我们正在尝试将数组插入到 php 文件中然而我们可以将数组插入到 php 文件中但格式不符合要求我们有 2 个文件文件1 php
获取Flask应用程序的根路径

我正在开发一个 Flask 扩展我想在文件系统上的项目根路径中创建一个目录假设我们有这样的目录结构 project app tests my folder manage py my folder 应该由扩展动态创建它是一个测试实用程序
为什么 findViewById() 在这里不能像 getActivity().findViewById() 一样工作？

A placeholder fragment containing a simple view public static class PlaceholderFragment extends Fragment public Placehol
如何控制用户输入的地址显示404

我想在用户输入未知地址时显示 404 页面如上图所示之后我可以控制未知地址index php但不知道如何在之前的部分执行此操作index php part 我编写这段代码是为了控制用户输入的内容index php 看起来你的开发机器上有
支持 DOM 样式访问的 Java JSON 库

我正在用 Java 编写一个 JSON 风格的查询引擎它将受益于通过 DOM 路径查询 JSON 文档的能力就像在 Javascript 中所做的那样我检查过 GSON 和 Jackson 但似乎都不支持这一点除了我自己的之外有人
Microsoft graph API：无法使用生成的访问令牌获取用户

我已在 Azure 门户中注册了该应用程序并生成了 client secret 我需要客户端授权流程并且我也授予了应用程序权限我也已授予管理员同意因为我自己就是管理员我可以使用给定的 url 生成访问令牌 https login
Rails：找不到railties

rvm v rvm 1 10 2 by Wayne E Seguin lt email protected gt Michal Papis lt email protected gt https rvm beginrescueend com
C++的recv()问题

我想发送一个字符串 Hello there 但我只收到 re 这是为什么 void Accept SOCKADDR IN sock int intsock sizeof sock remoteSocket accept desc LPSOC
Vuejs 3如何将变量传递给槽内的所有元素

我正在使用 VueJs 3 创建一个动态表组件其中涉及将循环索引变量发送到插槽内的所有子组件组件的用法如下
无法加载从带有标识符的包中的笔尖引用的图像

如果需要复制项目 gt 完成区分大小写 gt 已注意图像位于项目文件夹内这里可能有什么问题 Xcode 版本 9 0 我通过将图像导入资产 Assets xcassets 并从那里引用它来解决这个问题看起来 Xcode 9 中的构建
如何切换浏览器操作的操作？

我已经创建了我的第一个 chrome 扩展它将事件处理程序添加到单击时页面上的所有锚元素如果用户第二次单击该图标事件处理程序将重新附加到锚元素并执行两次我需要以下内容单击浏览器操作将事件添加到锚元素如果可能请在浏览器操作图标
时间：2019-03-17 标签：c#webrequestpostimagetowebapi

我在将图像上传到我正在运行的 Web API 时遇到问题使用 GET 请求时我可以从 Web API 检索数据但在处理 POST 请求时遇到问题我需要将 BMP 图像上传到 Web API 然后发回 json 字符串 HttpPos
如何使用 Google Chrome 扩展更改所选文本的 CSS

我正在为 Chrome 浏览器制作一个扩展它使用 contextMenus 来更改所选文本的 CSS 但我无法访问 HTML 结构即所选文本的父节点就像在本示例中可以轻松做到的那样 var selection window getSe
Instagram ?__a=1 url 不再工作 & graphql/query 获取数据的问题

4 月 19 日更新使用cookie几天后ig pr前两天是块看起来现在获取数据的唯一方法是使用sessionid具有特定值 Original 我正在使用 instagram a 1 url 来阅读 Instagram 用户的所有帖子
MySQL：将大表拆分为小表的最快方法

我有一个非常大的表其中有近 3 亿条记录由于 select 查询对我来说太慢了所以我想将其拆分为大约 800 个小表数据集如下所示 XXXXXX column2 column3 column4 XXXXXX column2 colu

MySQL：将大表拆分为小表的最快方法

MySQL：将大表拆分为小表的最快方法 的相关文章

随机推荐

热门标签

MySQL：将大表拆分为小表的最快方法的相关文章