首页 > 智能网

西部数据创新存储架构 助力IPFS突破算力瓶颈

来源:智能网
时间:2021-04-21 16:02:21
热度:79

西部数据创新存储架构 助力IPFS突破算力瓶颈4月9日至11日,第九届中国电子信息博览会(CITE2021)在深圳会展中心举办。同期有多场重磅会议及技术论坛开幕,其中4月9日举行的

4月9日至11日,第九届中国电子信息博览会(CITE2021)在深圳会展中心举办。同期有多场重磅会议及技术论坛开幕,其中4月9日举行的深圳国际大数据与存储峰会以及Web3.0中国峰会格外引得业界关注。

西部数据展台

作为世界存储巨头,西部数据携旗下一系列存储产品亮相展会,尤其是面向未来的IPFS数据存储解决方案更是亮点十足。西部数据公司副总裁兼中国区业务总经理刘钢也在Web3.0中国峰会上为我们带来了以“创新存储架构,突破IPFS算力瓶颈”为主题的演讲。

西部数据公司副总裁兼中国区业务总经理刘钢

·企业级存储架构面临挑战 IPFS发展迅猛

我们的世界正全面交由数字构建,大数据发展的尤为迅猛。据IDC预测,到2024年,以HDD为代表的大数据预计将增长到1.62ZB。而主要以SSD为介质的快数据在2024年也将增长到333EB。相较于HDD大数据30%的年增长率,SSD快数据50%的增长率是非常快的。

如果统计整个2024年产生的数据,总容量将会达到惊人的143个ZB,也就是说大数据和快数据加起来也只有约2 ZB,也就是仅有1.5%的数据被存储。

我们经常说,数字时代,数据就是石油,为什么这多的数据没有被存储下来,继而进行分析并挖掘其价值?很重要的一个原因是存储架构和存储技术没有及时地跟上,以至于有很多数据没有办法被存储下来并及时使用。

现代企业级数据存储架构正面临着严峻的挑战。迅猛的数据增长速度、对于存储性能的高要求、更低的总拥有成本(TCO)以及更加环保的绿色能耗体系等多个方面的要求亟需存储架构的革新与变化。

目前,数据的传输与访问,是基于HTTP协议为代表的互联网协议实现的。互联网将计算机与智能移动终端连接在一起,使得用户能够访问存储其他终端上的海量数据。数据以计算机、终端域名为地址进行中心化存储,带来了巨大的流量访问和数据传输压力。

而IPFS去中心化分布式存储架构将会有效降低目前基于中心化的云存储成本,将和去中心化的云计算一起作为Web3.0的重要基础设施,加快推动相关行业的数字化转型进程,构建商业新场景,促使经济社会发生深刻变革。

IPFS 是InterPlanetary File System的缩写,译作星际文件系统。简单而言,IPFS是一个内容可寻址的对等超媒体分发协议,用户要寻找的是存储在某地方的内容,这些内容分散在不同的服务器节点,而不是某个地址,因此只需确认验证内容的哈希值,就可以达到访问目标,大大减小了中心存储的压力。

有了面向未来的IPFS存储架构,还需要将数据进一步细分,这就涉及到了分层存储。按照数据的热度和使用频率,我们可以简单的将其分为极热数据、热数据、温数据、冷数据和极冷数据。

事实上,我们很难找到一种存储介质、存储设备能够同时满足所有层级的数据存储需求,对于不同层级的数据,需要采用的存储介质和存储的设备是不一样的,这样才能够既满足海量数据的存储和对热数据的快速访问。

大数据部分主要针对冷存储和极冷存储,业界通常使用高密度的大容量企业级HDD来进行。目前,已经进化到了18TB容量的高密度硬盘产品。西部数据的Ultrastar DC系列硬盘已经在多个云服务商处得到验证与部署。西部数据基于SMR(叠瓦市磁记录)技术开发的企业级HDD,已经做到了20TB的容量,几家头部云服务商部署的硬盘在过去4年当中,已经从8TB容量进化到了18TB,发展非常迅速。

西部数据公司副总裁兼中国区业务总经理刘钢

但更为惊人的是,IPFS服务商的硬盘容量演进速度。在过去的四个季度,他们几乎就走完了传统云服务商用时四年才完成的存储容量升级,也就是说从8TB进化到了18TB。

抛开升级速度,无论是IPFS服务商,还是传统云服务商,使用单盘容量越来越大的HDD是统一的,为什么大家从8TB不断升级至12TB、14TB,继而到现在的18TB?其实很简单,在同样存储容量的情况下,使用18TB硬盘可以大大减少服务器的数量,提高存储密度,从而降低功耗,降低部署成本,最终降低运维成本。

IPFS存储与数据分层,让我们有可能使用各种产品的存储组合,来满足用户各方面、各种存储场景的需求,继而解决未来数据时代的存储痛点。

·西部数据领先产品 赋能IPFS存储与计算集群

作为世界领先的存储架构公司、在存储领域深耕第51年的存储巨头,西部数据拥有完整的企业级存储产品线。

在HDD方面,西部数据的SMR技术已经成功应用到20TB容量的硬盘上了,一些客户通过部署Ultrastar DC HC650 20TB SMR HDD,得到了更低的总体拥有成本(TCO)与更高的存储密度。全球领先的云存储服务商Dropbox是首批测试验证西部数据Ultrastar DC HC650 20TB SMR HDD的公司之一。

对于需要频繁访问的快数据部分,像热存储、温存储,西部数据主要提供了两种不同类型的SSD产品,像面向极热存储的Ultrastar DC SN840 NVMe SSD,主要针对写入负载密集的负载而设计,可以帮助用户完成高性能的计算工作。而Ultrastar DC SN640 NVMe SSD更多应用到主流的服务器和云上,适用于读写均衡的混合型工作负载。

对于企业级客户来说,选择SSD供应商需要考虑很多因素,足够的产能与供应能力,足够低的成本和领先的性能,以及良好的纵向优化能力,都是影响用户购买决策的重要方面。

而这几点,恰恰是西部数据的优势。西部数据刚刚推出了第6代3D闪存技术,162层的3D闪存会进一步提高侧面单元密度,相比BiCS5相比,芯片尺寸减小40%,程序性能可以提高两倍以上,输入/输出性能提高约66%。西部数据与铠侠一起投入巨资,拥有领先的闪存产能优势,占有全球近3分之一的Flash产能。

此外,西部数据还拥有完全自主的控制器和固件,和NAND Flash纵向集成,有助于性能和稳定性的不断优化,确保客户采购的产品在整个生命周期内拥有稳定的I/O一致性。

在IPFS存储系统中,“存算分离”是一个特别重要的特点。也就是说存储集群和计算集群是分开的,两个集群的存储特性有着明显的区别。

如果使用西部数据的18TB HDD,以4U60+18TB的解决方案为例,与传统的4U36+16TB组合相比,机柜数量可以减少约46%,功耗减少约36%,明显降低部署成本和运维成本。

目前,西部数据已经与多家合作伙伴联合推出了IPFS存储解决方案,例如星辰天合、浪潮和西部数据共同推出的IPFS存储系统,使用了西部数据Ultrastar DC HC550 18TB HDD、浪潮英信服务器NF5466M5、XSKY文件存储系统等关键组件,不仅实现了快速部署、便捷运维,还有助于减少业务的异常情况带来的损失,大幅提升业务收益。

在基于分布式存储的Web3.0架构之下,西部数据展示了全方位的技术实力和相应解决方案,赋能IPFS基础设施建设。与业内合作伙伴一起打造的针对IPFS优化的计算和存储节点方案,可以帮助客户更好的挖掘出大数据时代数据的真正价值。