文档库 最新最全的文档下载
当前位置:文档库 › 海量数据下分布式数据库系统的探索与研究

海量数据下分布式数据库系统的探索与研究

海量数据下分布式数据库系统的探索与研究
海量数据下分布式数据库系统的探索与研究

海量数据下分布式数据库系统的探索与研究

摘要:当前,互联网用户规模不断扩大,这些都与互联网的快速发展有关。现

在传统的数据库已经不能满足用户的需求了。随着云计算技术的飞速发展,我国

海量数据快速增长,数据量年均增速超过50%,预计到2020年,数据总量全球

占比将达到20%,成为数据量最大、数据类型最丰富的国家之一。采用分布式数

据库可以显著提高系统的可靠性和处理效率,同时也可以提高用户的访问速度和

可用性。本文主要介绍了分布式数据库的探索与研究。

关键词:海量数据;数据库系统

1.传统数据库:

1.1 层次数据库系统。

层次模型是描述实体及其与树结构关系的数据模型。在这个结构中,每种记

录类型都由一个节点表示,并且记录类型之间的关系由节点之间的一个有向直线

段表示。每个父节点可以有多个子节点,但每个子节点只能有一个父节点。这种

结构决定了采用层次模型作为数据组织方式的层次数据库系统只能处理一对多的

实体关系。

1.2 网状数据库系统。

网状模型允许一个节点同时具有多个父节点和子节点。因此,与层次模型相比,网格结构更具通用性,可以直接描述现实世界中的实体。也可以认为层次模

型是网格模型的特例。

1.3 关系数据库系统。

关系模型是一种使用二维表结构来表示实体类型及其关系的数据模型。它的

基本假设是所有数据都表示为数学关系。关系模型数据结构简单、清晰、高度独立,是目前主流的数据库数据模型。

随着电子银行和网上银行业务的创新和扩展,数据存储层缺乏良好的可扩展性,难以应对应用层的高并发数据访问。过去,银行使用小型计算机和大型存储

等高端设备来确保数据库的可用性。在可扩展性方面,主要通过增加CPU、内存、磁盘等来提高处理能力。这种集中式的体系结构使数据库逐渐成为整个系统的瓶颈,越来越不适应海量数据对计算能力的巨大需求。互联网金融给金融业带来了

新的技术和业务挑战。大数据平台和分布式数据库解决方案的高可用性、高可靠

性和可扩展性是金融业的新技术选择。它们不仅有利于提高金融行业的业务创新

能力和用户体验,而且有利于增强自身的技术储备,以满足互联网时代的市场竞争。因此,对于银行业来说,以分布式数据库解决方案来逐步替代现有关系型数

据库成为最佳选择。

2.分布式数据库的概念:

分布式数据库系统:分布式数据库由一组数据组成,这些数据物理上分布在

计算机网络的不同节点上(也称为站点),逻辑上属于同一个系统。

(1)分布性:数据库中的数据不是存储在同一个地方,更准确地说,它不是

存储在同一台计算机存储设备中,这可以与集中数据库区别开来。

(2)逻辑整体性:这些数据在逻辑上是相互连接和集成的(逻辑上就像一个

集中的数据库)。

分布式数据库的精确定义:分布式数据库由分布在计算机网络中不同计算机

相关文档