EMC与NetApp NAS对比(1):易用性天上人间

概述  由于工作原因,本人管理着国内大型互联网公司的存储设备,一直以来公司都使用 NetApp的NAS产品,接触了NetApp的NAS有5年了,而后期由于商务上的原因,也引入了几台EMC的 NAS,两者并存一年使用下来两相对比,辛酸苦辣不足为外人道也。  为了让兄弟公司的弟兄们能够清楚了解...显示全部
概述
  由于工作原因,本人管理着国内大型互联网公司的存储设备,一直以来公司都使用 NetApp的NAS产品,接触了NetApp的NAS有5年了,而后期由于商务上的原因,也引入了几台EMC的 NAS,两者并存一年使用下来两相对比,辛酸苦辣不足为外人道也。
  为了让兄弟公司的弟兄们能够清楚了解两者之间的差异,在设备选型时不至于被厂商的销售忽悠,特写此文揭露两家NAS产品的真面目。本文将会好话少坏话多,把厂商试图隐藏的最最丑恶的角落展示在舞台中央。
  1. NAS结构对比
  为了能够清楚地说明两者之间的差异,先画一个草图来辅助说明它们的结构:


  · 左边的NetApp FAS产品,其控制器完全承担了所有工作,包括RAID、文件系统、网络IO、HA等等,EMC的SE会鄙视其为“PC架构”,但不可否认的是,它是一个完整的、一体的产品。
  · 右边的EMC NS产品,实质上是CLARiiON的软硬件+PC(EMC叫DataMover)+DART,CLARiiON处理RAID,PC处理文件系统和网络 IO以及HA,由一个或二个Control Station来协调配置。
  根据以上结构示意图,接下来讲讲他们两家有什么差异。
  2. 易用性:天上人间
  这方面可以给NetApp 打90分,而EMC只能得60分(分数为主观判断,读者可以根据描述自行斟酌)。
  由于NetApp的Data ONTAP操作系统是与设备一体化的,所有的功能设置在一个框架下完成,可以说一个熟练的管理员可以在5分钟内将一套FAS设置完毕投入使用。
  而EMC的NAS产品更象一个整合拼凑的东西,必须通过Control Station分别给CLARiiON的FLARE和DataMover的DART发送相应指令才能完成设置。这就造成了易用性上的问题,虽说也是一个界面下完成工作,但这就引入了很多局限性。例如其设置向导仅支持预定义好的几种RAID,例如4+1的RAID 5,如果你想要5+1的呢?对不起不支持。如果非要这么做也是可以通过MVM实现的,但向导不能用了,你得自己定义好RAID组、划好LUN、输出给 DataMover… 预留两天时间吧。
  另外在Control Station上遇到过下列问题:
  · JAVA进程死掉,无法登入,只能重启Control Station ——EMC无法解决
  · 在Control Station上执行了划分一个文件系统的操作后,后台会处理一段时间,在这段时间内是无法进行设置NFS export权限之类的配置操作的。曾经在FC盘的Pool中划了个15TB的文件系统,1个小时内无法操作(SATA盘这个时间是1.5小时),如果这段时间内你遇到个需要对另一个文件系统增加export权限的需求,那over了,等吧。——EMC回复无法解决此问题。
  · 在文件系统内的文件数量达到一个比较大的量之后,Control Station的管理界面中就看不到这个文件系统的一些信息了。——EMC的解释是数值超过了它的软件中字段上限,溢出故无法查看了。
  · 配置关联性差,删除一个卷,用命令行server_export居然还可以看到这个卷的export条目,需要手工去删除,而NetApp是随着卷删除关联的配置自动删除的。
  易用性方面EMC唯一比NetApp强的地方:Control Station可以支持多个用户同时登录,而NetApp在同一时刻仅支持一个用户登录。
  所以,易用性方面
  NetApp:★★★★☆ EMC:★★★收起
参与7

查看其它 4 个回答黑色代码的回答

EMC与NetApp NAS对比(2):性能-真实的谎言

  3. 性能:真实的谎言

  这里不介绍性能的具体的数字,SPEC网站上有SFS97、SFS2008的测试值,可以自行去查看。这里要说明的是网站上、销售嘴里告诉你的性能指标背后的含义。

  EMC的销售会这样说:我们的 NS系列产品性能指标比NetApp同等档次产品的性能要高,你看我们的值是…… 某些兄弟可能会想到测试的设备配置是否相当、盘数量是否一致等等,没错了。但藏在这背后的还有一件事值得留意:这些性能测试值是个和值,还要参考多少个 “机头”参与了测试。如果一个业务需要一个能满足特定负荷的共享文件系统,那么一定要考虑单个“机头”是否能够满足这些性能指标,不能被整机测试成绩欺骗。因为不管EMC还是NetApp,它们的多个blade或者两个控制器是不可以共享一个卷输出同一个文件系统的。

  参考第一节的设备结构,EMC NAS后端是一台CLARiiON设备(或者DMX),在NS960与FAS3170竞争时,EMC SE会说NS960有32GB的cache,每个DataMover有8GB的Cache,而NetApp每控制器16GB总共也就32GB Cache,并且CX960的32GB Cache还可以供多个DM共享提升性能。——听起来很有道理,Cache是多一些,但是这里面有两点要记住:

  1. Cache差异并不是(8*n+32)GB与32GB那么大,大家知道CLARiiON的Cache也是系统占用+镜像写缓存+读缓存的,32GB只是个数字,能等效为20GB很不错了,DM上的8GB也不全是数据缓存,当然NetApp的32GB也不是全部为数据缓存,这里只是说明差异没有那么大;

  2. 成也萧何,败也萧何,EMC引以为豪的所谓“共享”缓存,在后端存储遇到RAID故障、电源故障等需要Disable写缓存时是个杯具,所有的DataMover全部萎靡,而NetApp不会有这个问题,两个控制器间不会互相影响;分享一个真实案例:在NS960上,配置了FC磁盘(蓝色)的pool作为业务使用,等量SATA磁盘(绿色)的pool作为业务数据的备份copy,用Replicator进行数据复制,如下图所示:



  当SATA盘遇到磁盘损坏时,DM2提供的FC磁盘组成的业务卷出现读写缓慢现象,追查原因,SATA盘rebuild比较慢,且 rebuild时磁盘繁忙,而Replicator的数据又开始传输,数据挤占了EMC自以为是有益的“共享”Cache,导致本不应受影响的业务卷出现 IO缓慢,最终是停掉Replicator了事。

  打标时,EMC SE会指责NetApp的双控制器如果要实现Active-Active,则每个控制器只能用一半性能,否则故障接管时会吃不消,这个好理解,我们也认可 ——但如果EMC的NS它如果只配两片DM你就要小心了,NS的A/A模式是不会互相接管的,至少要配第三片DM作为Spare,这个DM不能分配任何工作,只是由它来接管A/A中间的任一个。

  NetApp另一个为人诟病的性能问题是WAFL碎片化,初始安装的NetApp性能确实非同一般,EMC的人承认比不过它,但文件系统用到 80%以上时,WAFL的随处写就受限制了,不能随心所欲写了,性能就会有所下降;并且WAFL的设计方法就决定了它的文件系统宏观上的分布一定是越用越乱的;而EMC的NAS文件系统不存在这个问题。

  所以,性能方面是各有千秋了,需要管理员想清楚自己要什么

  NetApp:★★★☆ EMC:★★★☆

  4. 高可用性

  EMC NAS在一个DataMover故障时切换到另一个DM需要耗时1分钟左右,故障恢复时切换回来同样需要1分钟左右(实测值);而NetApp通过IB(新一代产品是10GbE)保持两个控制器间数据通讯,加上具电池保护的NVRAM日志,在故障时可以快速获取必要的数据然后重建服务,切换能够在数秒钟内完成,当然故障恢复后回切是按照停服务-启动OS-提供服务的流程走的,耗时也要1分钟左右。

  而在EMC NAS模拟链路故障的拔光纤测试中,拔一条光纤路径顺利切换,CPU负载无变化;拔除全部的两条光纤,DataMover的CPU负载上升至 40%,5分钟后切换至备用DM,NetApp无测试记录,待以后补充。

  模拟网络故障的拔网线测试中,EMC NAS在Fail-Safe模式下拔除一条网线切换需8-10秒,NetApp NAS在active-standby模式下排除一条网线切换耗时1秒。

  EMC NAS使用的UxFS文件系统可靠性不如WAFL文件系统,在必要的时候必须执行fsck来扫描文件系统错误,而WAFL是时时刻刻保持一致性的文件系统,电池保护的NVRAM记录日志供故障恢复时“重演”,所以它根本不需要类似fsck的操作。

  说到这里,很明显了,高可用方面

  NetApp:★★★★ EMC:★★★
2012-05-07
浏览2800

回答者

黑色代码 最近回答过的问题

回答状态

  • 发布时间:2012-05-07
  • 关注会员:1 人
  • 回答浏览:2800
  • X社区推广