老虎头上的强
作者老虎头上的强2020-09-22 10:22
产品总监, IPS

新常态,新核心,新Power

字数 8386阅读 827评论 0赞 1

新常态

2020 年春节前后突然爆发的新冠疫情使得整个社会仿佛暂时停止了运行。虽然大家都不得不采取宅在家里的方式为国做贡献,但各家各户还是要解决自己的吃喝问题,于是线上抢菜成了时尚。随着时间的推移,到了三、四月份,各地防控形势逐渐好转,各企业工厂学校复工、复产、复学。但此间的人们还都尽量保持着社交距离,于是原本已经受到互联网影响的社交网络进一步向线上转移, QQ 群、微信朋友圈、直播、网课和视频会议是整个上半年的主旋律。企业之间的沟通也随着人与人之间交往的网络化而逐渐转到了线上,有些企业甚至将经营活动中最需要面对面的环节:采购招标和签约,都通过一定的技术手段转到了网上进行。
这种线上的联系大大降低了交通的拥挤程度,提高了工作效率。一旦人们习惯了这种通过线上交流带来的好处,并且形成了固定的工作模式后,企业和消费者、企业和员工、以及企业和企业之间的交往会进一步向线上靠拢,此时再想回到之前线下的沟通方式就很难。当人们都已经习惯点开 APP ,大家就会用更丰富的形式来进行线上交易,随之就会涌现出更多的线上业务。

线上业务的增加,不仅仅让金融支付系统产生了翻天覆地的变化,还对其他行业的业务模式发起了挑战。 APP 支付已经从年轻人的专属应用扩展到了全民应用:菜市场里的小额现金支付变得不受欢迎;很多小型餐饮企业的收银台不仅没有 POS 机,也拒收现金;大多数的超市更是将可使用信用卡支付的柜台缩减到了零星几个。随着疫情的防范在全国范围内常态化,这种线上业务的快速增长也将会是一个常态,这种常态又进一步推进数字化经济的发展由量变到质变,终最引领实体经济的增长。

随着线上业务的爆发性增长,企业原有的线上线下互为补充的 O2O (Online to Offline ,或 Offline to Online) 模式将不再能满足业务的需要,线上线下深度融合的 O&O (Online and Offline) 模式将会是企业未来的发展方向。

在企业向 O&O 的模式转型的过程中,线上业务与线下业务必然深度集成,交易链路融会贯通,数字化原生业务不断涌现。金融数字化不再是引领潮流的先驱,而是顺应潮流的必然。传统金融业务也不得不进行快速变革以适应金融数字化的要求。金融数字化的发展必然又会催生更多数字化金融产品,如第三方支付, P2P 网贷,现金贷等,进而再影响到线下的经济生活。这种以数字化经济为引领,线上线下深度融合发展的情况将会是中国经济发展的新常态。

新核心

随着 O&O 的推进,社会的运转模式变化了,整个经济的能量也会进一步的放大,在这个基础之上,企业的数字化之路也将成为必然。

每个企业都有一些核心的数据,比如说账务数据、交易历史、客户名单等。这些数据都是企业最核心的机密,每条记录都有可能事关企业的生死存亡,称为高价值密度数据。企业每天都围绕着这些高价值密度数据在运转。最早的时候,这些核心数据储存在纸制帐本上,后来逐渐储存到以 Excel 为代表的电子表格里,再后来慢慢进入到 ERP 、 CRM 等各种管理数据库里。这些数据库作为核心数据的存储体,或者说结构化的数据作为核心商业数据的存储体,在我们整个信息系统里面始终是存在的,我们称它为传统核心数据。

企业的传统核心数据体现了两个特点,第一,随着企业业务人员越来越依赖信息系统,这些核心数据的价值和作用越来越大,对保存它的可靠性和利用它的高效性就会有更高的要求;第二,随着线上业务的增加,尤其是那些高度依赖线上流量的企业,每停机一分钟都有可能造成几十万甚至上百万、上千万的损失,所以系统的不间断性或是可用性就尤为关键。

企业另外的一些数据则与传统核心数据不同。比如银行里面为了核实储户身份,储户要对着摄像头举着身份证说两句话,这样的数据算是低价值密度数据。对于低价值密度数据,上百兆的数据量可能只能提取出一条有用信息来进行数据校验。这种数据虽然不是企业生存的核心数据,但也是企业运营不可或缺的基础数据,我们称之为新兴核心数据。

随着企业业务的高速增长,传统核心数据的增长速度一般只会比业务的增长速度高一个量级,而企业的新兴核心数据则会呈几何量级增长。一个企业在创业的时候可能只有几十 GB 的新兴核心数据,到后来发展到一百多 TB ,甚至上 PB ,如果要实现数据的快速处理,势必需要更大的系统以适应数据的爆炸性增长。与此同时,随着业务的发展,传统核心数据对系统的可靠性、可用性等方面也会提出更高的要求,传统系统升级势在必行。

为了应对这种挑战,能够同时支撑传统核心数据和新兴核心数据的新核心系统必须同时具备纵向扩展和横向扩展的能力。纵向扩展代表着更高的单机性能、更强的数据一致性,更高的可靠性和可用性;横向扩展代表着更好的可扩展性,能够实现敏捷、高效的部署以及数据的最终一致。因此,新的核心系统必须建立在高可靠,高度虚拟化的硬件平台之上,该平台中既要有具有极致单机性能的纵向扩展服务器,又要有可以高效支持容器、分布式存储等应用场景的横向服务器。

新 Power

提到 Power 服务器,很多人可能忍不住的会想这是一个应该和恐龙同时灭亡了的系统。但事实上,今天的 Power 依然存在于这个市场上。

市场上某些技术派企业确实可以凭借一己之力,使用廉价的产品解决复杂的问题。比如谷歌雄霸全球的搜索引擎是以普通 PC 主板为基础构建的,堪称用蚂蚁组建了一头大象。同样,淘宝也是用他们自己创建的分布式系统完美应对了双十一当天两千多亿的交易额。但对于大多数不希望在 IT 建设上浪费时间和精力的用户来说,他们更希望用产业界高品质的软硬件产品来解决问题。

新核心的系统将不得不适应 7x24 小时的运行模式以满足线上业务的要求,这对高度依赖线上流量的企业是一个巨大的挑战。这种企业的核心系统仅仅靠三个 9 的可靠性是明显不行的,他们必然要追求四个九甚至五个九的可靠性,而 Power 完全可以满足这个级别的需求。根据 ITIC 发布的 2019 年企业级服务器系统可用性的数据中可以看到, Power 每年非计划停机的时间只有 0.08 个小时,也就是 4.8 分钟,远远小于五个九要求的 5.26 分钟。

对于大多数企业来说,在新常态下主要的业务变化是线下转线上。传统的核心系统要向新核心系统迁移,并且在迁移的过程中还要保障系统的稳定性和可用性。于是最好的做法就是以虚拟机的方式迁移到新的平台上。

原先传统的核心往往是一个集群,不论是双机热备,两地三中心,还是双活,都是以某种模式存在的集群。这种集群可以很平滑的通过 Power 提供的在线迁移工具,以虚拟机的形态逐一迁移到以 Power 为基础的云平台上,在不间断业务的同时实现新旧核心的转换。对于一些新兴的应用,也可以灵活的在 Power 平台上去构建基于容器云的分布式架构、微服务架构和所谓的 serverless 架构,使用基于 Power 的 Linux 服务器为新兴业务的上线提供完美的支撑。

于是在新常态下,基于新核心的要求, Power 又被赋于了新的含义。

首先, Power 已经不是原来的 IBM Power ,而是 K1 Power 。自从 2018 年 5 月 2 日起,由浪潮电子信息产业有限公司控股, IBM 参股,成立的浪潮商用机器有限公司在中国大陆地区全面开展以 POWER 处理器为核心的服务器业务。新公司以浪潮 K1 高端 Unix 服务器为基础,融入 POWER 先进的技术,打造全新的 K1 Power 服务器产品,在中国本地生产制造,致力于为用户提供更加完整、高效的整体解决方案,提供专业、敏捷的软件和技术服务。

K——面向关键应用设计 Key Business

K1 Power 中的 K 代表的是 Key Business ,或者是 Key Application ,对应的就是新核心。

近十五年来,随着 x86 处理器性能的提升以及新技术的涌现, x86 服务器的处理能力和稳定性已经是之前完全无法比拟的。同时,这种服务器和日常生活中的 PC 同根同源,很多日常工作中操作笔记本电脑、台式机的经验都可以被利用。于是 x86 服务器成了很多企业构建 IT 系统的首选。

但当企业发展到一定阶段后可能会发现 x86 系统不再适合了。这就好比是一个人,在刚大学毕业工作的时候没什么钱,家里完全不需要保险箱。在奋斗了十几年后有一部分人跨入了小康生活,家里或多或少有一些贵重资产,这时就可能需要一个床头柜大小的普通保险箱。再奋斗一段时间后,不少人在各自的领域成为了领军人物,有些人甚至成为了地方首富,这时一个更大更保险的贵重资产保管设备可能就变得必不可少。

在新常态下,新核心首要承担的是高价值密度数据,核心系统就相当于存放了事关企业生死资金的保险箱。在创业阶段,这个核心系统可能只需要一个纸制的帐本;当企业渡过了起步阶段,有了正常的现金流,业务稳定发展时,由 x86 服务器构建的核心系统就充当了床头柜保险箱的作用,虽然不是顶尖产品,但已经够用。而对于每个行业中头部的 20%-30% 用户,每位都是各自领域的领军人物,必然会有使用高品质的产品的需求,于是 K1 Power 服务器就会成为这些企业里贵重资产保管设备的必然之选。

当然,即使是在行业中 20%-30% 的头部企业里,也不是所有的数字化金融资产都有必要放到 K1 Power 这种高度可靠的保险箱中。但根据业界普遍认可的 20/80 原则, 在这些企业里,至少有 20% 的核心系统需要 K1 Power 服务器,所以我们说 K1 Power 服务器是面向关键应用而设计的。

1——最高技术规格 1 st

浪潮商用机器有限公司的 K1 Power 服务器与之前在中国大陆销售的 IBM Power 还有一个本质的不同: K1 Power 是基于全新的 POWER9 处理器全新打造的。在公司成立之后,浪潮商用机器有限公司已经先后发布了超过 10 款基于 POWER9 处理器的服务器,这些服务器的单机性能比之前的 IBM Power 服务器提高了 40%以上 ,大幅突破了之前 Power 服务器的极限。

K1 Power 中的 1 代表的就是 No.1. 这个 No.1 既是技术规格的 No.1 ,又是用户选择的 No.1 。在技术规格上,不论业务有多么复杂,除了某些互联网企业外, K1 Power E980 这样级别的服务器可以满足大约 95% 以上甚至 98% 以上的企业对核心数据的要求。

对于客户来讲,核心数据不论是在传统数据中心还是在云上,无论是用虚拟机的形式还是用容器的形式进行部署,用户的第一选择一定是 Power 。为什么是 Power 呢?第一, Power 有极致的性能;第二, Power 系统的设计是面向未来的;第三, Power 有敏捷和智慧的特性;极致的品质、可靠性、和稳定性则是 Power 一直以来的传统价值。这就是 Power 这几个字母所代表的含义 。

P——极致性能 Performance


经过这么多年用户的实际使用, K1 Power 已经证明了单机可以支持上百套关键应用,可以支持高达一千个分区,每年处理亿级交易量。这个不是无依据的吹牛,阿里双 11 当天第一个小时的交易量不可谓不高,但在几年前线下业务还依然盛行时,曾经某使用 Power 的银行用户看到了这个数据不屑地评价说“这只不过是一个正常的周一上午 10 点至 11 点的交易量”。

一台 Power 服务器最多有 16 颗处理器,一颗处理器有超过十个核心,每个核心都有八个线程,配合完善的 CPU 互联结构,负载越高, Power 运行起来越是游刃有余。与之对应的是,业界公认 x86 服务器很难在高负载的情况正常运行。

POWER 不但“多心”,更“高频”。 POWER 处理器的主频主要都是在 3GHz 到 4GHz 之间,反观 x86 则是以 2GHz 为核心生产力。与 x86 相比,得益于高主频的 Power 带来的性能提升更加明显 。

POWER 处理器的内存带宽和 I/O 带宽都是 x86 的 2 倍。于是我们经常可以看到一个现象:当用户把系统负载加到一定的并发量,四路 x86 服务器 CPU 的利用率往往要达到 90% 以上甚至出现无响应的状态,但同样的负载在 Power 两路服务器上也可能就 60% 。造成差异的主要原因是 x86 器内存带宽和处理器带宽形成了拥塞。此外, POWER9 芯片上的三级缓存高达 120MB , x86 只有 40 兆,缓存容量提高的直接好处是提升了 CPU 与内存之间数据的吞吐速度,间接提高了带宽和性能。

O——面向未来业务 Future-Oriented


上面谈的 Performance 主要是面向传统核心——面向从 MySQL 到 DB2,Oracle 等要求数据强一致的集中式数据库系统。新兴的数据,特别是低价值密度数据都是围绕着容器云,大数据应用、内存计算、分布式存储、人工智能,甚至一部分高性能计算而展开的。

Power 得益于系统性能在指标上的支撑, IO 吞吐性能非常高,再加上单 CPU 核心能够分配到的大容量的内存和缓存,使得 Power 在所有这些领域里都能有很好的应用。

IBM 在上个月发布了新一代 POWER10 的芯片,根据 IBM 在 Hot Chip 大会上透露出来的技术细节中不难发现, Power10 不仅可以实现单一服务器上三级内存管理,而且每台服务器还可以直接使用集群中其它服务器的内存。这一切显然都是为面向未来业务而设计的。

W——智慧敏捷 Wise & Agile


新常态下的新核心中必然有一些新的应用,这些新应用很大部分是围绕着开源生态部署的。 K1 Power Linux 产品与传统的运行 AIX 的 K1 Power 服务器不同,它是专为微服务、开源数据库等的新兴应用而开发的。在 K1 Power Linux 产品上即可以使用 KVM 虚拟化连接到 Openstack 架构的云环境中,也可以使用 K8S 构建容器云平台实现敏捷交付。

谈到敏捷交付,现在业界可能有个误解。很多人都认为敏捷交付就是把所有 IT 系统全面转向分布式数据库平台和业务平台。但是一方面很多操作高价值密度数据的系统并不适合转向分布式数据库,另一方面,对大多数企业来说,不大可能培养上千人的技术团队伍去搞一个分布式平台。

阿里为了完成 OceanBase ,用了两到三代的研发人员,耗时十几年才有现在的结果,并且这套系统也只能在阿里的生态系统里面运转顺畅。近期也有 Power 的用户尝试使用自建分布式系统替代 Power 服务器,虽然用户非常成功地实现了数据的迁移和系统的切换,但我们也看到客户的 IT 硬件环境比之前多了几百台服务器,研发和运维人员也从一百多人扩展到了上千人,整个 IT 的成本结构随之发生了很大的变化。

建立独立的分布式系统最大的压力还是整个业务的逻辑要改变。在集中式数据库系统环境下,业务逻辑都是紧偶合的,可是在分布式系统中就要对业务进行解耦,实现业务松逻辑。于是原先在秒级时间内能完成的数据同步,现在要放松到分钟级,甚至要放松到小时级。这就意味着如果存一笔钱到账户里,几分钟内有可能会看到不一致的情况,真正在全系统中实现数据一致的时候可能已经过去了一个小时。

这种情况在有些领域里可能是能被普通接受的,比如使用航空公司 App 买机票。 App 显示支付已完成,银行的短信也明确地显示机票款已付,可能在 3 、 5 分钟内里却始终无法查询到任何已购机票。

机票出票晚了 5 分钟对大多数人来说是可以接受的,但类似情况在股票交易领域里却是完全不可接受的。比如说在牛市中将资金从银行转入券商,如果在资金划转完成后,券商的交易系统无法实时显示这笔资金,或者 APP 上已经下单但系统没有立即执行,可能预期中的机会就没有了。

所以我们说 K1 Power 是用户智慧的选择,使用 K1 Power 服务器处理高价值密度数据,提供数据的强一致性;采用 K1 Power Linux 服务器处理低价值密度数据,实现 IT 的敏捷性。

E——极致品质 Extreme Quality


Power 基本上秉承了同仁堂的做法,既不省人工,也不省物料。首先, Power 服务器的主板是 40 层的。大家都知道,以当前的技术水平,主流 x86 服务器的主板都不到 20 层。在 x86 服务器上,一个 CPU ,两个内存通道,只要线路不交叉就可以放在同一层主板上。但在 Power 上,这样的通道都会被隔离到不同的板层上。这么做能最大限度地防止信号的相互串扰。

其次,我们知道电子物料对硫化物比较敏感,汽车尾汽、甚至厨房炒菜的油烟里面都含有硫化物。硫化物对于电子元器件表面有腐蚀作用,一旦元器件表面被腐蚀了就意味着从这个器件电路板上的通路、电阻的特性、电容的特性、承载能力都会发生变化,信号也会随之发生变化。信号的变化就意味着系统不稳定,所以 Power 在选物料的时候采取了多种办法解决硫化问题,比如使用高防硫化器件,或向电路板上涂抹隔离材料等。

再者,有过 DIY 组装电脑经历的人都知道散热片有导热硅胶,但现在 CPU 功耗越来越高,运行过程中散发的热量也越来越多,导热硅胶有的时候就会显得导热能力不足。 Power 在这方面用了一个比较高技术的东西叫铟片,这是材料科技上一个进步,可以大幅提高导热效率。铟片一片就要十几美元,导热硅胶的成本与铟片相比几乎可以乎略不计。这种高品质材料的选用在其它的服务器产品中是难以见到的。

最后是质量检测。浪潮商用机器是 IBM 和浪潮信息的合资公司,在生产制造中继承了双方母公司的优点,整个制造检测体系则是以两家母公司中要求更严格的一方为基础搭建的。 IBM 在电子技术领域有着近 100 年经验,本地的服务器研发队伍也是经历了第一台国产小型机 K1 的磨练,到现在已经有 26 年的高端服务器设计经验,在消化吸收 IBM 先进经验的基础上,浪潮商用又结合浪潮信息应对大规模生产和制造服务器中的实践对 IBM 的流程进行了提升。所以说浪潮商用的服务器设计队伍可以说是整个国内服务器行业里面最顶尖的,由这个团队设计出来的制程和检测标准也是国内服务器行业里最严格的,对应的产品也是品质最高的。

R ——极致可靠与稳定 High RAS


最后要谈一下稳定性和可靠性。追求可靠性不仅要靠品质,还要靠设计,不仅要解决物理上的问题,还要解决逻辑上的问题。

稳定性的实现要在系统架构设计上有相应的保障,这就是冗余。但冗余不是一个简单的技术,如果冗余不能保持同步,如果信号和数据在冗余部件之间不能保持一致,那不论这种冗余技术有多么先进,它都无法实现可靠的系统稳定性。

同时, IT 系统中的不可靠性因素非常多,其中一些更是源自我们生活的周围。例如电磁噪声在现代社会是不可避免的,而宇宙射线和α粒子在太阳风暴抵达地球时也会充斥在大气环境中。大家以为这些都是小概率事件,离我们很远。实际上对于计算机系统来讲,只要系统规模达到了一定程度,都会引发系统事故。从概率的角度来说,大规模系统中的单比特翻转是不可避免的。

为了解决上述问题,浪潮商用从 IBM 引入了冗余、隔离、修复等这些有着广泛实践的技术应用到 K1 Power 服务器上。从而延续了 Power 一贯的高稳定性和高可靠性,使之能够为新常态下的新核心保驾护航。

稳定可靠的另一方面是逻辑上的。现在云环境被广泛应用,虚拟机、容器的解决方案也都随处可见。新核心系统对整个软件栈也提出了稳定、可靠的要求。 Power 产品目前在这方面保持着领先的优势, PowerVM 虚拟化软件到目前为止还没有被发现有任何安全漏洞。在应用中也从没有听说任何一个客户的数据库在 Power 平台上被第三方突破。所以 Power 一直以来都是极致可靠与稳定的代名词。

随着新技术的涌现,现在的 Power 和 10 年前相比有了突飞猛进的进步。现在的 K1 Power 可以完美的支持多云架构。运行 AIX 操作系统的 K1 Power 产品线面向集中式架构,不仅仅能提供更稳定的核心支撑,更能实现云原生,方便新核心向下一代平台迁移和转化。与之对应的 K1 Power Linux 产品线可以为新兴的应用和容器化的部署方式提供更好的支撑。

所以在新常态下,国产的、基于 Power9 的,被赋以全新含义的 K1 Power 服务器必将是中国企业用户建设新核心的首选。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广