第三平台技术应用正驱动新兴存储架构涌现,全闪存阵列(AFA)和超融合基础设施(HCI)都是代表。这些架构是为有效应对一系列问题而设计的,如大量传统的存储基础设施、性能、数据增长以及随之而来的大量新需求、管理生产力、可靠性和效率等。对很多企业而言,虽然下一代应用程序正越来越多地托管在同一个整合的虚拟基础设施上,关系型数据库、消息和协作平台、文件共享这类传统应用依然需要持续支持。
IDC预计,未来十年,第三平台计算将主导IT基础设施决策。移动计算、社交媒体、大数据分析、云为代表的下一代应用正打开增长机会的大门,具有前瞻性思维的市场玩家将从中获益。规模是下一代应用的一大特征:这些应用程序需要成百上千万的IOPS,与大量数据集打交道,驱动对高带宽和PB级容量的需求。许多下一代应用必须容纳海量数据摄入,同时具备全球扩展能力,延迟则要低于当下全闪存阵列所能达到的水平。能够将数据快速转化成智能情报的实时分析(real-time analytics)将带来许多新的客户和市场机会。毫无疑问,这一能力是溢价的。
大数据/分析为创新者、开发人员和市场人员带来全新的、意料不到的洞察,这将改变企业市场,以及企业销售其产品和服务的方式。企业必须有能力收集、处理比过去大一个量级的数据集。速度也是成败的关键,机会可能转瞬即逝,或者根本无法通过传统的分析发现。短短几年内,那些不大量利用实时分析,没有足够灵活的、有能力快速响应机会的IT基础设施的企业,将在竞争中处于明显的劣势地位。那些知道向第三平台的转变是如何驱动全闪存阵列和超融合基础设施市场的企业,应该非常清楚,大数据分析的未来已经在驱动新一轮的存储架构革新。
为了在不断进化的大数据仓库中满足实时分析要求,组织正尝试使用全闪存阵列。不过,有能力容纳不断增长的海量数据集,这并不是这些系统的设计初衷。要想在运行实时分析的同时,有能力摄入新数据,就需要系统具备强大的数据服务能力,如重删、压缩、多数据副本管理等。现在,大部分全闪存阵列需要大量手动操作,工作负载必须分区并扩散到多个系统中,很多情况下,伴随着分区数据集的是多份数据拷贝。要想满足不同应用程序的服务水平协议(SLAs),提供所需的性能离不开多数据副本。但是,这对存储容量的使用效率又是一个巨大的挑战。对于全闪存阵列来说,速度只是一方面,要想充分发挥用武之地,平衡至关重要。在处理ETL作业时,全闪存阵列的带宽也有限,还有这些“数据规模扩展(data at scale)”环境下的决策支持需求。新兴存储架构就是为应对这些需求而生的,可能带来以下几个差异化的关键技术。
一、提供超常规的性能(延迟和吞吐量),服务器和阵列之间的主机连接必须进化,以支持低于100微秒级的一致性延迟水平。应对这一挑战,一个显而易见的解决方案是:扩展内部服务器总线,容纳共享存储。
二、系统应该围绕基于内存的存储介质构建,无需关心满足任何种类的旋转盘兼容性的问题。当与传统系统间不存在兼容性问题时,新兴存储技术在改善可靠性,降低能耗,提高存储密度等方面存在巨大的机会空间。对所有这些特征而言,规模化都是尤其重要的。
三、平台需要同时容纳不同种类的数据,结构化、非结构化和半结构化的,并且不会造成效率低下。要想将利用数据发现机会的能力最大化,企业需要有效地使用所有类型的数据,不偏向某种特定的类型。
四、我们需要摆脱现在相对重的I/O栈,通过全新的系统架构转向为使用场景专门开发的堆栈。许多数据分析应用是自定义编写的,API可充分利用这种精简(且延迟低得多)的I/O栈,能为那些想要优化存储系统性能、可靠性和效率的开发者带来显著优势。
IDC观察发现,专门应对规模化大数据分析的下一代存储架构正开始出现。鉴于未来几年大数据和分析市场的规模,与目前我们所能看到的新兴存储架构市场相比,相关的存储基础设施支出有望大幅增长。2016将会是有趣的一年,这些面向大数据的存储解决方案开始出现并得到采用。
欢迎大家继续关注慧邮件邮件营销平台,也可以在我们的慧邮件官网了解更多邮件营销技巧,大数据知识,也可以通过电话:400-666-5494联系到我们,更多精彩知识、活动等着你。