您的位置:首页 > 新闻中心
五德新闻

云计算:云中的一个现实的分析

2013-10-29

  不久将有无数的DBMS产品在云中公布。今天在这里,最具创新性的新的云计算服务相结合的新的DBMS软件,真正利用云架构以改变经济和商业分析的响应。
 
  我的信念是,云计算将改变商业智能(BI)的经济,使各种新的分析数据管理项目和业务实现可能性。它这样做是通过硬件、网络、安全、软件需要建立数据集市和数据仓库可按需付费的方法来使用。
 
  一个计算云,如亚马逊弹性计算云,是由成千上万的商品服务器上运行多个虚拟机(VM)的情况下在云中托管的应用程序。为这些应用程序的变化的客户需求,新的服务器加入到云或闲置和新的虚拟机实例化或终止。
 
  从最内部数据仓库和数据集市的基础设施云计算基础设施显着不同。有没有几十个CPU核心,SANS,复制系统,或专有数据仓库的家电可以在云中高端服务器。因此,一个新的数据库管理系统软件体系结构是必需的,以使大容量的数据进行分析的快速而可靠地对云的商品硬件。最近DBMS的创新使今天的现实,最佳的云数据库管理系统的架构将包括:
 
  1. 无共享,大规模并行处理(MPP)架构。在巨大的网格中为了压低成本创建一个公用计算环境,最佳的云服务提供商使用相同(或类似)的计算要素。在网格中的每个节点通常是一个计算引擎,具有其自己的附加存储。 对于云数据库成功地“向外扩展”,在这样的环境中,它是必不可少的,该数据库有一个无共享架构利用的资源(CPU,内存和磁盘)在服务器节点添加到集群。今天普遍使用在BI大多数数据库共享一切或共享存储体系结构,这将限制他们的能力。
 
  2. 自动高可用性。在一个基于云的数据库集群分析,节点故障,节点的变化,和连接中断都有可能发生。 鉴于广大云内的处理元素,如果数据库具有适当的内置故障转移功能,这些故障可以给最终以透明的方式传递给用户。最好的云数据库将在云计算集群的节点之间自动复制数据,能够在1个或多个节点故障(“K-安​​全”)的情况下继续运行,并能自动恢复的节点上恢复数据 - 无需DBA援助。理想的情况下,复制的数据将在“活跃”在不同的排序顺序查询,以提高性能。
 
  3. 超高性能的云改变游戏规则的优势之一是迅速的分析应用能力(无需等待硬件采购)。然而,可以有一些性能损失是由于互联网连接速度和虚拟化云环境。如果分析的表现令人失望,失去优势。幸运的是,最新的无共享(shared-nothing)的柱状数据库,专为分析工作负载而设计,比传统的,面向行的数据库(如验证,如Gartner,由行业专家和顾客基准),他们已经证明了显着的性能改进。 该软件性能的提高,加上规模经济的硬件所提供的云环境中,在新的经济模式的结果分析云和竞争优势。
 
  4. 主动的压缩,由于云计算成本通常由收费处理器和磁盘存储的利用率,积极的数据压缩会导致非常大的成本节约。面向行的数据库,可以实现约30%至50%的压缩系数。但是,除了必要的索引和物化视图通常扩张到2?5倍的大小的源数据的数据库。但是,由于在一列中的数据往往是更相似,重复比行内的属性,列数据库通常达到更高的程度的压缩。他们也没有要求指标。其结果通常是柱状数据库所需的存储量减少20倍和相称的存储成本降低了4倍。
 
  5. 基于标准的连接,虽然有一些特殊用途的文件系统已被开发为云环境,可以提供高性能,他们缺乏标准的连接需要支持通用的业务分析。分析用户的广泛基础,将使用现有的商用ETL和报告软件依赖于SQL,JDBC,ODBC和其他DBMS连接标准来加载和查询云数据库。因此,它必须对云数据库来支持这些连接标准,使分析应用程序的广泛使用。
 
  总之,上述建筑特点的云数据库将不只是能够在云中运行,但依然存在的有:
 
· 因为云本身“向外扩展”
· 没有高端或定制硬件的快速运行
· 在流体计算环境提供高可用性
· 最大限度地减少数据存储,传输和CPU利用率(保持低成本的云计算)