数据库技术(大数据数据库技术简介与分类分析)

2022-09-15 05:18:21 发布:网友投稿
热度:40

数据库技术(大数据数据库技术介绍及分类分析)

大数据生态

传统数据库技术与新型数据库。

从大的角度来看,数据库可以简单地分为两类:

●传统SMP架构数据库主要指传统资源网络的关系数据库,如DB2、Postgrel、MySQL等。

●新型数据库主要是指为支持大规模数量集、高并发需求和高扩展性而孕育的新型数据库。包括当前大数据生态中主流MPP、nosql和newsql数据库。

在这里,我还是想推荐一下我自己的大数据学习交流qq裙:957205962,都是关于大数据开发的。如果您正在学习大数据,边肖欢迎您的加入。大家都是软件开发党,不时分享干货(只跟大数据开发有关),包括一篇自己编的2018最新高级数据和高级开发教程。欢迎想要深入大数据的高级和进阶合作伙伴。

传统数据库和新数据库的主要区别之一是SMP架构VS分布式/并行。

数据库的理论基础。

理论基础-服务器系统架构。

●对称多处理器

SMP是对称多处理器架构的简称,意思是多个CPU对称工作,没有主次关系。每个CPU共享同一个物理内存,每个CPU对内存中的任意地址都有相同的访问路径(访问时间相同),所以SMP也叫UMA:统一内存访问)。

●NUMA(非统一内存访问)

NUMA是一种不对称的多处理结构,与SMP正好相反。当多个CPU工作时,它们对内存的访问路径是不同的。针对SMP架构下的多CPU扩展问题,提出了NUMA架构。

●大规模并行处理

与NUMA不同,MPP提供了另一种扩展系统的方式。它是一个从用户角度出发的服务器系统,由若干个SMP服务器通过某个节点互联网络连接在一起,协同工作,完成相同的任务。

SMP和NUMA主要指向一个单一的计算机系统,而MPP则有些集群化。

理论基础——ACID基础理论。

低原子性(原子性)

整个事务要么成功,要么失败,部分成功被消除。

低一致性(一致)

事务不会改变数据库中数据的一致性。例如,如果a+b=10被完全约束,并且一个事务改变了A,那么B也应该相应地改变。

低独立性(相关)

也称为隔离,它意味着两个以上的事务不会交错执行,因为不可能造成数据不一致。

耐用性低(耐用)

交易成功执行后,公司对数据库所做的更改将永久存储在数据库中,不会无故回滚。

传统的基于关系模型的数据库遵循ACID的基本理论,而新的分布式数据库并不完全遵循这一理论。

理论基础——分布式C资源网络的AP理论。

低一致性(一致)

也就是数据的一致性。简单的资源网络意味着数据被复制到N台机器上。如果有更新,N台机器的数据要一起更新。

低可用性(可用性)。

当集群中的一些节点发生故障后,整个集群也可以响应客户端的读写请求。

低分区容错(容差)

分区发生,但不影响整个系统的运行。

在这里,我还是想推荐一下我自己的大数据学习交流qq裙:957205962,都是关于大数据开发的。如果您正在学习大数据,边肖欢迎您的加入。大家都是软件开发党,不时分享干货(只跟大数据开发有关),包括一篇自己编的2018最新高级数据和高级开发教程。欢迎想要深入大数据的高级和进阶合作伙伴。

传统的基于关系模型的数据库更注重CA,而新NoSQL数据库更注重CP和AP。

下一篇:弗兰奇和罗宾(为什么说弗兰奇和罗宾是天生一对 )
上一篇:姚崇简介(救时宰相:姚崇)