如何进行Dell EMC PowerMax细节解读

本篇文章给大家分享的是有关如何进行Dell EMC PowerMax细节解读，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。作为一个叫“高端存储知识”的公众号，如果不解读一下Dell EMC最新发布的PowerMax，肯定是不称职的。虽然网上已经很多帖子了，但是，很大网友还是想看看西瓜哥怎么想，怎么评价这款代替高端存储VMAX的大怪兽。Dell EMC PowerMax
EMC推出这款新品，我其实是有一点预期的。因为DSSD退市的时候，EMC就表示其技术可能会用于下一代高端存储，因此，高端存储支持NVMe，应该是迟早的事情。只是没有想到，EMC的步子迈得这么大。现在你去看EMC的产品页，已经找不到VMAX，甚至VMAX-AF都不见了。当然，如果你用搜索还可以看到。说明VMAX和VMAX-AF还在销售，但是不主推了，未来的高端存储只属于PowerMax。其实，根据Gartner 2017年Q4的数据，我统计了一下，EMC的VMAX-AF已经占据高端存储的3/4了。也就是，高端存储形态现在基本都是全闪存形态了。说句大实话，看趋势，你不得不佩服Gartner。Gartner在2016年在IT Market Clock for Storage的报告里，就预告了高端存储快退休了。也就是，高端存储还有2-5年就到Replacement阶段，这个阶段，用户不应该再新购买高端存储了。16年后的2年，不正好是2018年吗？EMC的步伐看来还是踩到了点上了。这次PowerMax采用NVMe架构，这也在Gartner的预测之中。Gartner觉得2018年NVMe后端会得到采纳，而2019年前端NVMe-oF才会来临。未来主流的NVMe-oF协议可能是FC和RoCE。PowerMax的路标好像也是这样的。其实华为在2017上半年就推出了NVMe产品，Pure Storage在下半年推出。而PowerMax在2018年推出。论踩点，我只服EMC，O(∩_∩)O哈！oooO ↘┏━┓ ↙ Oooo( 踩)→┃你┃ ←(死 ) ( →┃√┃ ← ) /　 _)↗┗━┛ ↖(_/好了，下面言归正传，我们来解读解读这款PowerMax。首先，PowerMax的关键字就三个：快速，智能和效率。和VMAX-AF对比：1、SAS变为NVMe，性能大幅提高，因此更快了；2、引入AI/ML，有了一定的自动运维能力，因此更智能了；3、除了压缩，多了对重删的支持，因此效率更高了；具体这次Dell Tech World 2018上，EMC发布了两款PowerMax，2000和8000。Power这个名字估计来自Dell服务器PowerEdge，没有办法，因为现在存储的领导基本都是Dell的人了。我对比了一下，除了性能快外，软件特性基本和原来VMAX-AF一样，只是少了一个CloudArray的云网关功能，估计以后会补上。CPU还是v4，没有用最新的v5。端口还是16G FC，还没有支持32G FC，25G等高速接口。这个路标好像是2019年。指标上，我们也看到，最大支持有效容量是一样的，还是最多4PBe。按照EMC的定义，这个有效容量是包含thin，重删压缩和快照的容量。也就是说，其物理的裸容量其实不是太大的。大家如果看过我以前的分析就可以看出，这是VMAX遗传下来的限制。因为VMAX支持的最大有效容量和内存大小有关，现在PowerMax最多的内存也是16TB，和VMAX一样，因此，其支持的最大有效容量也只能是4PB了。下面我分别展开来讲讲这三个关键字。一、快速EMC号称PowerMax是世界上最快的存储，说句老实话，如果在中国，我们可以告EMC违反广告法，O(∩_∩)O哈！不过，从指标来看，确实挺快的，比如千万IOPS，虽然全部是内存命中下测得的，没有啥参考意义。不过，时延还是说明一定的问题。对比VMAX-AF，时延下降25%，如果用SCM，会下降一半。快的原因不多说了，就是NVMe和SCM。二、智能现在你发布一款产品，不说AI都是可耻的。PowerMax也不例外。也就是以后存储也”自动驾驶”了。发布会上，EMC堆砌了一堆数据，一句话，PowerMax能处理这么多数据，不然怎么好意思叫big data，O(∩_∩)O哈！不过吹了这么多，真正落到的场景，主要在数据的智能布局上。也就是分析应用，然后你知道这些数据放在SCM还是Flash上更合适。不过，EMC这个特性要2019年才出来，现在只是提前宣传，因为现在还不支持SCM。不过，这个思路不是EMC发明的，是高端存储之父Moshe Yanai发明的，他在设计的第三代高端存储Infinibox里，采用AI的方式来做Cache，号称”neural caching”，我在文章AI在企业存储已有三大落地应用，你知道吗？里介绍过。不过，目前PowerMax的缓存算法没有AI功能，我看EMC的资料说PowerMax的Cache命中率只有50%，人家Infinidat宣传自己的神经缓存算法的Cache命中率可以超过98%。也许明年PowerMax AI版本上线才能改善这个指标。还有一个地方会用AI，就是在压缩处理部分。如果用AI分析某些数据是热数据，就先不用压缩了，因为反复压缩和解压还是浪费大量的资源的。这个也是有意义的。这个资料里面都没有提到，我是听媒体的采访才知道的。可怜我蹩脚的英语，希望没有听错。不过，这个也需要等AI版本出来才行。一句话，智能是路标，PowerMax现在还没有比VMAX-AF聪明。三、高效大家知道，VMAX-AF有压缩功能，但PowerMax多了一个重删功能，因此号称可以做到5:1的数据缩减比。效率还体现在空间的节省。还有功耗的减低上。
不过，这块人家Pure Storage表示不服。Pure的//X采用CFM，自己做的NVMe板卡，密度更高一些，而且Pure的数据缩减自认为做得比PowerMax好，因此，空间的节省更多一些。但是，拿人家一个机柜来比就有点搞了，因为那个机柜还是很大地方空的，可以放其他设备啊。
讲完3大关键词，我想看看一些实现的细节，特别是区别于VMAX-AF的。A、Smart RAID首先讲讲EMC老强调的双端口NVMe，这个没啥特别的，为了可靠性和性能，NVMe SSD最好是双端口的，华为的Dorado v3用的NVMe SSD也是双端口的。一般消费级的NVMe都是单端口的。由于是双端口，因此每个控制器（Director）都可以访问一个端口。因此，EMC还包装了一个术语Smart RAID，由于NMVe协议的并行性，因此每个控制器都可以同时访问所有的SSD，不管你是否在一个RAID组内。其实SAS盘也是双端口的，但是由于SAS/SCSI协议没有并行能力（一个LUN只支持一个队列），因此，无法做到Active/Active的RAID组共享。2、NVMe磁盘框的连接EMC在PowerMax后端采用PCIe，而不是像很多Startup公司采用RoCE来连接。由于原来的存储都没有支持PCIe的磁盘框（DAE），因此，这是全新的硬件。EMC还是设计成24个小盘，2U高度的DAE。如果是PowerMax 2000，一个引擎（2控）可以连接两个DAE。2000最多支持4控，因此，连接方式如下：但是如果是高端的PowerMax 8000，连接方式就奇怪了。2个引擎（4控）最多支持3个DAE，也即中间有一个DAE是两个引擎共享的。看了一下，以为EMC也搞一个HDS和华为老吹牛的4坏3设计，即中间那个DAE的数据很安全，因为任意一个引擎（2控）故障，另外一个引擎也有线路相连，也就是可以访问？其实不是这样。大家仔细看中间的DAE，其实分成两个部分，前14个盘位是引擎1来控制，后面10个盘位（编香港云主机号15-24）是由引擎2控制。也就是各访问各的，如果引擎1故障，那么引擎1管理的盘也不能被引擎2访问。我们看到，中间的DAE的中间4个盘位（编号13-16）是用来专门放置热备盘的，也就是说，PowerMAX的RAID机制还是VMAX那套，还是需要专门的热备盘的。中间的DAE为什么不平分，而是前面14个盘给引擎1，后面10个盘给引擎2。估计和RAID组的设计有关。EMC一般采用8个盘一个RAID组，7+1或者8+2。不过，PowerMax支持的最大有效容量是由内存的大小决定的，因此，瓶颈并不在盘数上。我用PowerMax Studio做了一个最大配置，大家看看下半部分的DAE的盘是怎么插的（上面部分是一样的），很不规律，而且有很多盘位空的。C、重删压缩EMC的PowerMax这次多了重删，但压缩功能也和原来VMAX-AF不同。不过，两者都通过专门的硬件加速卡来实现的。大家看看，引擎里面，NVMe的后端卡和数据缩减卡着两种类型的卡是新的，其他的卡都是原来VMAX-AF有的。引擎之间还是采用Infiniband连接。这个模块不仅仅负责写入数据的重删压缩，还负责SRDF复制时候的数据压缩。这是重删压缩特性对比。我们看到，压缩多了一个EDC，即扩展数据压缩功能。这个功能是系统不忙的时候，去看看那些不常用的数据是否可以进一步压缩，这样可以获得更好的压缩率。这个思路其实是向Pure Storage学的。还有，压缩的算法不同。PowerMax采用DEFLATE算法，而VMAX-AF采用LZS算法。具体区别大家百度吧，下面是无损压缩算法的发展一览表。我的数学不太好，对其差别了解不多。不过，PowerMax的压缩有一点做得不好，估计是为了保证SRDF的兼容性，数据做远程复制的时候，先要解压，然后再用SRDF的算法进行压缩，对端收到后也多了一个解压的再压缩的过程，比较浪费资源。说完了压缩，我们来看看重删，这个是新特性。从EMC提供的流程看，没有看到hash ID一样然后进行数据比对这个步骤。
也就是说，PowerMax和XtremIO一样，都是采用强hash算法（文档说采用SHA-2算法），不比对数据的处理方式。这个和NetApp、Huawei的思路不同。理论上有hash冲突的风险。D、SLA服务模式这个和VMAX一样，采用SLA来进行等级划分。不过，VMAX靠的是调整LUN的闪存百分比来调整服务等级，而PowerMax都是NVMe了，只能通过Host I/O Limit来控制前端端口的I/O来降速了。看，全是NVMe SSD，居然也提供7.2ms时延的铜牌服务。这些主要给ISP用的，因为有些用户希望便宜的服务，需要把体验降下来，不然就卖不了贵的服务了。E、秒级NDUPowerMax继承了VMAX的可靠性，甚至秒级NDU能力。
原理就是升级的时候提前把代码装载到EEPROM里，然后所有控制器同时热加载，整体系统只需要10s左右就可以完成升级，业务不中断。F、LUN归属问题我们知道，VMAX是没有LUN归属的，也就是LUN可以被多个控制器同时读写，I/O无需转发。但是，LUN没有归属，下面某一个逻辑块还是需要有归属的，HPE 3PAR是CK，而VMAX就是TDAT。
SmartRAID的描述就提到，TDAT是有归属的。这样设计的好处就是主机只能看到LUN，看不到TDAT，TDAT有归属就不需要锁机制，系统性能更好，而且主机可以对同一个LUN多路径负载均衡，控制器切换主机不感知，业务影响小。好，到这里，我想到的技术要点解读都解读完了。最后给大家提一个问题，根据IDC的定义，PowerMax到底算原生型还是改良型呢？确实，PowerMax有很多新东西，但是，我们看软件上和VMAX基本一样，特别是RAID方式和SRDF压缩的实现等等，我们都看到很多妥协。也就是还是有历史包袱的，不可能像全新设计的架构一样轻装上阵。不过，改良型也有改良型的好处，就是功能丰富，成熟度高。当然，不好的地方就是有妥协，性能无法发挥到极致。以上就是如何进行Dell EMC PowerMax细节解读，小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注开发云行业资讯频道。

相关推荐: 怎么进行Cloudera访问授权

这篇文章将为大家详细讲解有关怎么进行Cloudera访问授权，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。01—Cloudera访问授权概述授权是任何计算环境的基本安全要求之一。其目标是确保只有适当的人员或流程…