大规模数据库架构
-
带着通信这两个字的
-
分布式数据库是物理上分散、逻辑上集中的数据库系统,其目的主要是实现本地自治和数据全局透明共享。
-
分布式数据库系统由局部数据库管理系统、全局数据库管理系统、全局数据字典、通信管理四部分组成。
-
分布式数据库最基本的特征:本地自治、非集中式管理、高可用性
-
分布式数据库的分布透明性包括:分片透明性、位置透明性、局部数据模型透明性
分片透明性:最高层次的透明性,位于全局概念与分片模式之间;
位置透明性:位置透明性使用户编写程序时只需要考虑数据分片情況,不需要了解各分片在各个场地的分配情况;
局部数据模型透明性:最低层次的透明性,不需要了解场地上使用的是何种数据类型,位于分配模式与局部概念模式之间;
-
分布式数据库分片类型:水平分片、垂直分片、导出分片、混合分片
水平分片:按一定的条件把全局关系的所有元组划分成若千不相交的子集,每个子集都是关系的一个片段;
垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片
导出分片:又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件
混合分片:以上三种方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式的分片,但他们的结果是不相同的
-
进行垂直分片以后,每个分片都必须包含关系的主键
-
进行水平分片以后,关系的每一行必须至少属于ー个分片,每个分片的元组结构完全相同
-
并行数据库中一维数据的划分方法:轮转法、散列划分法、范围划分法
轮转法:扫描整个关系表
散列划分法:点查询和顺序扫描
范围划分法:适合范围查询和点查询
-
数据分配方式有四种:集中式、分割式、全复制式、混合式
**集中式**:所有数据片段都安排在同一个场地上;
**分割式**:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上;
**全复制式**:数据在每个场地重复存储。也就是每个场地上都有一个完整的数据副本;
**混合式**:**一种介于分割式和全复制式的分布方式**,全局数据被分为若干个数据子集,每个子集都被安排在一个或多个不同的场地上,但是每个场地未必保存所有数据。
-
层次结构可以分为两层,顶层是无共享结构,底层是共享内存或共享磁盘结构;无共享结构被认为是支持并行数据库系统的最好并行结构。
-
局部概念模式是描述全局关系在场地上存储的物理片段的逻辑结构以及特征。
-
软件即服务:互联网上的应用服务一直被称作软件即服务,它是一种软件分配模式。
平台即服务:指通过网络提供操作系统和相关服务而无需下载或安装。
基础设施即服务:指将用于支持运作的设备对外提供服务,这些设备包括存储、硬件、服务器和网络组件。
-
并行数据库系统的体系结构主要有3种:共享内存结构、共享磁盘结构和无共享资源结构。
共享内存结构:共享一个公共的主存储器,如果处理器数量过多,容易造成内存访问冲突。
共享磁盘结构:所有处理机都没有独立的主存储器,并且通过互联网共享磁盘。
无共享结构:,每个处理机拥有独立的主存储器和磁盘,不共享资源。
层次结构综合了共享内存、共享磁盘和无共享结构的特点。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)