[SQL系列] 从头开始学PostgreSQL 分库分表

2023-11-15

什么是分库分表

分库分表是一种数据库架构设计的方法，用于应对大规模数据的存储和查询。当单个数据库的存储容量或查询性能无法满足需求时，可以通过将数据分散存储在多个数据库服务器上，以提高系统的可扩展性和性能。
分库分表通常包括两个步骤：分库和分表。

分库

分库是指将单个数据库按照一定规则划分为多个数据库，每个数据库可以存储一部分数据。这样可以减少单个数据库的数据量，提高查询效率。常见的分库方式包括垂直分库和水平分库。

垂直分库是指按照功能模块或业务领域将数据分成多个数据库。例如，可以将订单数据、用户数据、商品数据分别存储在不同的数据库中。
水平分库是指按照数据特征将数据分成多个数据库，例如按照时间、地理位置等。例如，可以将订单数据按照月份分别存储在不同的数据库中。

分表

        分表是指将单个表按照一定规则划分为多个表，每个表可以存储一部分数据。这样可以减少单个表的数据量，提高查询效率。常见的分表方式包括垂直分表和水平分表。
        垂直分表是指按照功能模块或业务领域将表分成多个部分。例如，可以将订单表按照订单状态分成多个部分。
        水平分表是指按照数据特征将表分成多个部分，例如按照时间、地理位置等。例如，可以将订单表按照月份分别存储在不同的表中。

从PostgreSQL 11开始，就有三种表分区：

1. 范围分区（Range Partition）

范围分区是将表按照某个列的值划分成一段或多段。每个分区的端点值存储在 pg_partition_range 系统表中。范围分区支持基于时间戳的自动分区，例如根据日期列自动创建每天、每月、每年等分区。

2. 列表分区（List Partition）

        列表分区是将表按照某个列的值存储在数组中，每个分区的值存储在 pg_partition_list 系统表中。列表分区的支持比较灵活，可以自定义分区值，也可以使用预先定义好的列表进行分区。
        3. 哈希分区（Hash Partition）
        哈希分区是将表按照某个列的值进行哈希运算，将结果映射到不同的分区。哈希分区可以使用任何哈希函数，例如 MD5、SHA1 等。哈希分区的优点是可以平均分布数据，避免某个分区存储过多数据，提高查询效率。

示例

1. 创建主表

首先，我们需要创建一个主表，用于存储所有分表的公共字段和索引。在示例中，我们创建一个名为 customers 的表，其中包含 id、name、age 和 address 列。

testdb=# CREATE TABLE customers (  
 id SERIAL PRIMARY KEY,  
 name VARCHAR(50) NOT NULL,  
 age INT NOT NULL,  
 address VARCHAR(100) NOT NULL  
);

2. 创建分表

接下来，我们需要创建多个分表，每个分表都包含主表的所有字段和额外的特定字段。在示例中，我们创建年龄分区表

user=# create table customers_10 () inherits (customers);
CREATE TABLE
user=# create table customers_20 () inherits (customers);
CREATE TABLE
user=# create table customers_30 () inherits (customers);
CREATE TABLE
user=#

user=# \d
                 List of relations
 Schema |         Name          |   Type   | Owner
--------+-----------------------+----------+-------
 public | customers             | table    | user
 public | customers_10          | table    | user
 public | customers_20          | table    | user
 public | customers_30          | table    | user

3. 定义分表规则

使用 PostgreSQL 提供的分表规则（partitioning）功能，定义如何将数据分配到不同的分表中。在示例中，我们使用 AGE 列作为分表规则，将数据分配到 customers_age 分表中。

首先创建一个function，年龄为（0，10）， [10，20）, [20, ...)分别插入三张不同的表里。

然后创建一个trigger，在插入到customers之前开始执行这个function。

这样子当我们向这个customers表插入数据的时候

user=# create or replace function customers_partition_trigger()
returns trigger as $$
begin
if NEW.age < 10 then
insert into customers_10 values (NEW.*);
elseif NEW.age < 20 then
insert into customers_20 values (NEW.*);
else insert into customers_30 values (NEW.*);
end if;
return null;
end;
$$
language plpgsql;
CREATE FUNCTION

user=# create trigger insert_customers_partition_trigger
user-# before insert on customers
user-# for each row execute procedure customers_partition_trigger();
CREATE TRIGGER

4. 向表中插入数据,这里数据仍会显示在父表中，但是实际上父表仅仅作为整个分区表结构的展示，实际插入的记录是保存在子表中。

user=# INSERT INTO customers VALUES (1, 'Alice', 25, 'New York');
INSERT 0 0
user=# INSERT INTO customers VALUES (2, 'Bob', 35, 'San Francisco');
INSERT 0 0
user=# INSERT INTO customers VALUES (3, 'Charlie', 18, 'Chicago');
INSERT 0 0
user=# INSERT INTO customers VALUES (3, 'Charlie', 18, 'Chicago');
INSERT 0 0
user=# select * from customers;
 id |  name   | age |    address
----+---------+-----+---------------
  3 | Charlie |  18 | Chicago
  3 | Charlie |  18 | Chicago
  1 | Alice   |  25 | New York
  2 | Bob     |  35 | San Francisco
(4 rows)

user=# select * from customers_10;
 id | name | age | address
----+------+-----+---------
(0 rows)

user=# select * from customers_20;
 id |  name   | age | address
----+---------+-----+---------
  3 | Charlie |  18 | Chicago
  3 | Charlie |  18 | Chicago
(2 rows)

user=# select * from customers_30;
 id | name  | age |    address
----+-------+-----+---------------
  1 | Alice |  25 | New York
  2 | Bob   |  35 | San Francisco
(2 rows)

5. 设置分表约束，加快查询效率。因为如果查询主表的话，会直接扫描所有的子表来查询，但是如果加上constraint的话，会允许规划器根据条件查询对应的子分区，在数据很多的情况下可以加快查询速度。

user=# alter table customers_10
user-# add constraint customers_10_check_age_key
user-# check (age < 10);
ALTER TABLE

user=# alter table customers_20
user-# add constraint customers_20_check_age_key
user-# check (age < 20);
ALTER TABLE

user=# alter table customers_30
user-# add constraint customers_30_check_age_key
user-# check (age < 30);
ALTER TABLE

优缺点

分库分表都有一定的优缺点，下面来盘点下。

优点

提高系统可扩展性：通过将数据分散存储在多个数据库服务器上，可以提高系统的可扩展性，方便扩展存储容量和处理能力。
提高系统性能：通过将数据分散存储在多个数据库服务器上，可以提高系统的性能，减少单个数据库的压力。
降低数据冗余：通过将数据分散存储在多个数据库服务器上，可以降低数据冗余，减少数据丢失的风险。

缺点

复杂性：分库分表需要对数据进行划分和维护，增加了系统的复杂性和维护成本。
数据一致性：分库分表可能导致数据不一致，需要额外的机制来保证数据的一致性。
事务处理：分库分表可能会影响事务的处理，需要额外的机制来支持跨库的事务处理。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

数据库

[SQL系列] 从头开始学PostgreSQL 分库分表的相关文章

在 Oracle 行的多个列上使用透视

我在 Oracle 表中有以下示例数据 tab1 我正在尝试将行转换为列我知道如何在某一列上使用 Oracle 数据透视表但是否可以将其应用于多个列样本数据 Type weight height A 50 10 A 60 12 B 4
如何在mysql中选择具有相同值集的列？

我的桌子是 patients pid name city disease did dname has disease did pid 我想列出具有相同疾病组的患者 pid 和 did 分别是患者和疾病表中的主键并且是 has diseas
MySQL - 从临时表插入

这看起来非常简单但我坚持使用简单的插入语句见下文 begin work CREATE TEMPORARY TABLE IF NOT EXISTS insert table AS select r resource id fr file
删除连接到另一表 SQL 的一个表中的记录

我有两个表一个包含 212 000 条记录已弃用的记录另一个包含 10 500 000 条记录我想在 id 和 version number 字段上连接两个表因为两个表都有这些字段我希望从连接表中删除匹配的记录来自连接表即从
Linq To SQL - 拥有和分组依据

我下面这个查询工作正常不过我想使用 Linq 来实现它 select u ID u NAME from Task t join BuildingUser bu ON bu ID BUILDING t ID BUILDING join Us
只获取倒数第二条记录 - mysql-query

我有一个如下表记录 my table id rating description 1 0 0 bed 2 1 0 good 3 0 0 bed 4 1 0 good 5 0 0 bed 6 0 0 bed 7 0 0 bed 现在我通过评级
如何通过子 POJO 的属性过滤复合 ManyToMany POJO？

我有两个像这样的房间实体 Entity public class Teacher implements Serializable PrimaryKey autoGenerate true public int id ColumnInfo n
在存储过程中验证用户的最简单方法？

我需要一个存储过程可以通过发送以下内容来检查登录尝试时他们是否是有效用户login and password查看它们在数据库中是否匹配有没有一种简单的方法可以做到这一点如果没有更多信息我目前能提供的最好信息是 CREATE STOR
快速查询最新记录的方法？

我有一张这样的表 USER PLAN START DATE END DATE 1 A 20110101 NULL 1 B 20100101 20101231 2 A 20100101 20100505 在某种程度上如果END DATE i
数据库字段中的逗号分隔值

我有一个产品表该表中的每一行对应一个产品并由唯一的 ID 标识现在每个产品都可以有多个与该产品关联的代码例如 Id Code 0001 IN ON ME OH 0002 ON VI AC ZO 0003 QA PS OO ME
在 SQL Server 上执行分页的最佳方式是什么？

我有一个数据库超过200万记录我需要执行分页以在我的 Web 应用程序上显示该应用程序每页必须有 10 条记录DataGrid 我已经尝试使用ROW NUMBER 但是这种方式会选择所有 200 万条记录然后只得到 10 条记录我也
如何在MYSQL中将整个字符串小写并保持第一个大写[重复]

这个问题在这里已经有答案了我的表栏目我预期的输出会在列中发生变化 Smith Allen Doyle Dennis Baker Waker 这是我尝试过的但不起作用 UPDATE TABLE employee SET last nam
提高第一个查询的性能

如果执行以下数据库 postgres 查询则第二次调用要快得多我猜第一个查询很慢因为操作系统 linux 需要从磁盘获取数据第二个查询受益于文件系统级别和 postgres 中的缓存有没有一种方法可以优化数据库以快速获得结果fir
如何识别拼写不同的相似单词

我想从数据库中过滤掉重复的客户名称一位客户可能有多个同名但拼写差异不大的系统条目这是一个示例名为 Brook 的客户可能有 3 个系统条目有了这个变化布鲁克贝尔塔布鲁克贝尔塔比鲁克贝尔塔假设我们将此名称放入一个数据库列
从 Getdate() 获取时间

我想采取Getdate 结果例如 2011 10 05 11 26 55 000 into 11 26 55 AM 我看过其他地方并发现 Select RIGHT CONVERT VARCHAR GETDATE 100 7 这给了我 11
SQL查询查找表的主键？

我怎样才能找到哪一列首要的关键使用查询来创建表这是重复的question https stackoverflow com questions 893874 mysql determine tables primary key dynami
mysql自动存储记录创建时间戳

mysql 有什么方法可以在创建记录时自动将时间戳存储在记录行中我试图使用时间戳数据类型和 current timestamp 作为默认值但后来意识到每次更新记录时都会更新我只需要一些可以存储创建时间戳的东西 Thanks Set
如何使用 BigQuery 有效地选择另一个表中匹配子字符串的记录？

我有一个包含数百万个字符串的表我想将其与包含大约两万个字符串的表进行匹配如下所示 standardSQL SELECT record FROM record JOIN fragment ON record name LIKE CONCA
Spark SQL 中的 SQL LIKE

我正在尝试使用 LIKE 条件在 Spark SQL 中实现联接我正在执行连接的行看起来像这样称为修订 Table A 8NXDPVAE Table B 4 8 NXD V 在 SQL Server 上执行联接 A revision
SQL 更新 - 更新选定的行

我正在使用 SQL Server 2008 我有一个名为MYTABLE有两列 ID STATUS 我想编写一个存储过程来返回其记录STATUS是 0 但是这个存储过程必须更新STATUS返回行数为 1 如何在单个查询中执行此选择和更新操作

随机推荐

用MySQL语法建一个学生表，包括学生姓名、性别、年龄、班级信息。

1 创建表的SQL语句 create table student ID int primary key not null NAME varchar 50 sex int age int classNO in 转载于 https www cn
SqlServer Management Studio启用身份验证登录

背景一开始安装好SqlServer Management Studio时默认只能用本地window身份验证登录也就是除了SqlServer的电脑别的都访问不了这个数据库这是很不方便的方案 1 打开SqlServer Manage
ubuntu安装无线网卡驱动

摘要在笔记本上安装ubuntu系统安装好后是可以连接wifi的而台式机安装ubuntu的话特别是组装的台式机是无法立即连wifi的是需要安装无线网卡驱动的如果你身边无法连网线而又无法连接wifi 根本无法更新或者下载所以
https证书申请 nginx ssl配置

打算开发api要弄一个https的域名于是我就搞了一个把过程记录下来留给有用的人分割线我用的是阿里云的证书现在有一个免费的不知道以后会不会一直有就在阿里云服务里CA证书服务就可以找到购买的时候选择自动生成证书这样就不用自己制
ionic5/angular11通过修改ShadowRoot样式更改ionic UI组件原样式

通过浏览器调试可以找到需要更改的UI组件样式找到其CSS class类名后通过CSS无法直接修改样式需要使用shadowRoot appendChild 方法注入新的样式覆盖原来的样式达到修改原样式的目的一编写HTML
农行网银登录无法显示该网页_Edge Dev新版发布：支持网页预加载以更快搜索和浏览...

今天早些时候微软宣布了 Edge Dev 通道的最新 85 0 531 1 版本本次版本更新支持某些网页的预加载可以更快地搜索和浏览该版本中还包含了一些BUG修复和改进下载地址 https www microsoftedgeins
C#DataTable转List互转

using System using System Collections Generic using System Data using System Reflection namespace BT Preservation Models
疫情期间沙雕文案

1 希望如约而至的不至是春天还有疫情过后平安的你 2 早知道半个月前是最后一次出门就不应该喝一杯奶茶 3 刚刚有人约我出去过情人节我果断拉黑删除了非常时期骗我感情可以但要我名不可以 4 烟花三月下扬州愿我三月能下楼 5 疫情你走
postman进行post、get参数传递及中文乱码和各类型参数传递和json格式传参和日期型参数传递和响应数据传回

postman是一种测试工具用postman直接在其上输入参数名和参数值就行不用区分post和get请求方法当然java代码要改变一点在响应注解的方法里面添加和postman中输入的参数名一样的形参 get请求代码注意在响应注解
Android 9 底部导航栏样式不正确

1 项目预制了GMS后底部导航栏只剩下一个返回键和唤醒Assistant的按钮需要回到原来的导航栏来修改方式屏蔽掉 config defaultAssistantAccessPackage 使用Android原始的config def
原码、补码、反码的关系及应用场景

是三种表示有符号整数的方法它们之间存在一定的关系概念原码是最基本的表示方法即将一个数的符号位和数值位分开表示符号位用0表示正数用1表示负数例如 7的原码为00000111 7的原码为10000111 反码是在原码的基础上将负
局域网、城域网、广域网、国际互联网（internet）

计算机网络按覆盖范围分类可分为局域网城域网广域网一局域网 1 地理分布范较小一般为数百米至数公里可覆盖一幢大楼一所校园或一个企业一个家庭 2 数据传输速率高一般为100Mbps 目前已出现速率高达1000Mbps的局域网
vue3 element-plus el-form的二次封装

form表单的二次封装 vue3 element plus el form的二次封装属性说明属性名类型默认值说明 data Array 页面展示数据内容 onChange Function false 表单事件 bindProps
R语言的科学编程与仿真 chapter 4 答案

chapter 4 Ex1 programe cha4 6 ex1 Ex1 https img blog csdn net 20151226125117523 12 25 15 author Sigua file path file age
java 加载oracle 驱动 19c_037、Java--JDBC技术

1 JDBC 简介 JDBC Java DataBase Connectivity java 数据库连接是 JavaEE 平台下的技术规范定义了在 Java 语言中连接数据执行 SQL 语句的标准可以为多种关系数据库提供统一访问数
https认证过程（TLS认证过程）

最近在准备春招刚好看到https 网上搜了一圈没看到满意的于是打算自己整理一下以下内容来源于计算机网络第8版谢希仁加上了一些自己的拙见目前的HTTPS是使用http tls的所以直接了解tls的认证过程即可曾经广泛使用的
SAP接口财务凭证集成_差旅费报销

OA系统调用此接口传输差旅费报销流程的凭证信息到SAP 生成借款类型SAP凭证调用标准的BABI方法实现 1 首先先介绍一下实现会计凭证生成的BAPI 参考链接 2 增强操作在另一篇文章 SAP接口财务凭证集成借款在此不再赘述 3
最近研究xcodebuild批量打包的一些心得

转自Rainbird的个人博客以前的时候只知道做安卓开发的兄弟挺辛苦的不但开发的时候要适配一堆的机型好不容易开发完了还要打一堆不同的包给不同的市场没想到现在这些市场都开辟iOS市场于是需要打一堆的包给不同的市场面对暂时给的十二个
+-1 RMQ

考虑分块令 b log 2 n
[SQL系列] 从头开始学PostgreSQL 分库分表

什么是分库分表分库分表是一种数据库架构设计的方法用于应对大规模数据的存储和查询当单个数据库的存储容量或查询性能无法满足需求时可以通过将数据分散存储在多个数据库服务器上以提高系统的可扩展性和性能分库分表通常包括两个步骤分库和分表

[SQL系列] 从头开始学PostgreSQL 分库分表

什么是分库分表

分库

分表

示例

优缺点

优点

缺点

[SQL系列] 从头开始学PostgreSQL 分库分表 的相关文章

随机推荐

热门标签

[SQL系列] 从头开始学PostgreSQL 分库分表的相关文章