作者是国内研究超融合相当早的专家,有非常强的理论基础和实战经验。上几篇分析文章,对nutanix/VSAN/深信服/H3C/EMC等厂家的深入分析,引起了业界很大的反响。
好饭不怕晚,专家最近工作特别多,为了不辜负各位喜欢这个系列的同学,辛苦工作到凌晨,再次推出本系列的第八篇,分析思科的上篇。希望喜欢的同学多多转发和点赞!
以下是超融合分析系列前面几篇,已经阅读过的同学可以跳过。
另外文章最后附有作者的微信,有兴趣的同学可以加作者做更深入的交流。
开篇
周二的时候朋友圈传遍了思科计划以3.2亿刀收购Springpath,本来我就计划本周发出思科的超融合分析,各种原因,导致错过了这个蹭热点话题的机会。下次发文章要乘早。不过说实话,没有服务器的HCI软件厂家日子不好过了,一直在掉价,nutanix股价掉了一半,最近稍有回升,还是不到IPO时的2/3,HP收购的simplivity 高达6.5亿刀,今年思科就减半将springpath买断了。
还是言归正传,回到对HyperFlex方案的分析。
思科的交换机+UCS服务器以及Springpath的HCI软件实现的HyperFlex超融合方案。
Springpath公司成立于2012年,一个年轻的小规模的初创存储公司。2016年3月Springpath被思科看中,选为战略合作伙伴,Springpath也转向成为一家只支持思科的OEM开发公司。当然现在已经准备卖身给思科了,也算一个好归属。
深入分析
HyperFlex一共有3种方案,严格意义上说只有2种:
一种是8盘的1U融合服务器HX220c M4,一种是23盘的2U融合服务器HX240c M4
第一:支持纯计算节点,但是确实采用刀片做纯计算。如果是选择23盘做融合存储,在存储能力足够的情况下,还能接入纯计算节点,但是这里接入计算节点是UCS B200 M4刀片。看到HyperFlex HX240 产品手册,我的确有点震惊:居然有机架+刀片的混合方案。虽然没有说机架和刀片不能组在一起,但是从硬件架构上,刀片服务器显得更高档,包含网络背板等,完全和机架服务器画风不一样。如果采用普通2U的机架服务器用来做纯计算节点,至少我觉得从外观上就一致了,少了很多非议。我在国内遇到一部分客户,就是一定要机架服务器,排斥刀片。当然也遇到部分客户因为空间的原因选择高密机架或者纯刀片方案。多一种硬件形态,就意味加大难度。感觉和超融合的理念冲突的。
第二:方案上一定要采用思科的交换机,通过交换机的确能实现一些高级的SDN功能。但是相对客户来说形成了新的绑定,投资也加大了,不一定适合小规模的试点或者中小企业。
第三:采用的是20G光纤交换机,目前大部分数据中心接入网络还是10GE组网,因为要使用HyperFlex就要把网络升级到20G,对客户来说增加了网络的管理难度,同时也加大了投资,实际上在超融合厂家下,10GE网络至少目前看并不是问题,大部分的HCI方案独立存储平面2个10GE网络足够了。为什么思科要采用20G,还同时支持IP和FC SAN网络,独行特立,还是为了推自己的交换机和SDN网络方案,让市场猜测。
第四:HyperFlex的融合部署方案其实和nutanix类似,或者说业界除了VSAN外,其它HCI全部采用控制虚拟机方案支持VMware虚拟化。HyperFlex有和nutanix不一样,它是采用板载的两个64SD卡部署ESXi和CVM虚拟机。可靠性相比来说起码做到硬raid1。但是可维护性就差了,如果坏掉一个SD卡,更换都只能停机拆箱更换。如果能部署在2个组raid1的普通硬盘中就更好了。
第五:上述型号中网口都是2*10Gb FCoE网口,和前面配置的20Gb的光纤交换机配合使用,再次明显觉得光纤交换机高配了,有内幕消息,麻烦知情的朋友私信给我学习一下。
第六:HXDP软件必须采用2个SSD盘,其中一个做cache,一个用来写日志。这样的方案也是很独特的:有日志不奇怪,但是单独搞一个盘就奇怪了,完全可以搞成日志分区。如果两个盘容量一样,起码在硬件设备上的角色定义就少了。毕竟越少越简单。
第七:HXDP在支持VMware时采用的是NAS进行VMware存储认证的。下图是我从VMware官网查询到的,可以作为参考。
第八:HXDP存储软件必须开启数据重删功能。实际上在大部分业务场景,在线的数据重删功能将加大时延影响,消耗更多的内存和CPU,用时间换空间,用客户体验换功能,这是和IT技术的发展违背的。早期的业务需求不敏感,存储相对较贵,所以存储中重删压缩是必备功能。当前3.5寸大盘已经到10TB,未来必然更大,每TB成本逐年降低的情况下,我们采用空间换时间才是正道。在整个IO路径上开启删除功能,必然增加IO处理时间,增加时延。最关键是这个功能居然无法关闭。根据官网材料,据称采用top-k专利算法,能做到性能影响小(没有说不影响性能吧)
在网上找到资料CVM需要48G到64G内存,8个vCPU,资源开销的确优点大。
压缩功能好像也无法关闭。
未完待续
今天先说到这么多,下次接着分析。
最后再次请求超融合圈的朋友们能(加我微信)发给我一些材料,不限于技术白皮书、PPT、最佳实践等,让我能将各个厂家的方案深入学习探讨,顺便写写分析文档,也能发出来让大家参考,提前说声谢谢。
为了方便大家相互交流学习,创建了一个公众号同名微信群:《大数据和云计算技术交流群》,欢迎大家加下面我的微信,我拉大家进群,自由交流。