荣瑜
作者荣瑜·2023-07-30 17:23
副总经理/副总裁·EasyStack

可进化之多元算力|为什么设计可进化的软件定义数字化基础设施

字数 3663阅读 397评论 0赞 0

概述:随着开源生态发展,多元化算力成为云技术基础设施核心能力中的重要组成部分,而多元算力的建设需要标准化、可进化的数字化基础设施,10年时间,易捷行云 EasyStack 设计了可进化架构的数字原生引擎,结合基于开源生态产品化的多种算力产品,为用户提供按需组合的多元算力云计算基础设施,搭配统一的 SDN 网络与 SDS 存储,为用户云计算建设提供可进化的解决方案。可进化之多元算力系列主题文章包含从设计理念与设计目标、产品能力、应用场景等系列文章。

多元算力是随着云计算和数字化转型的发展而逐渐兴起的。随着企业和组织在数字化转型过程中对计算资源需求的不断增加,传统的计算方式已经难以满足需求。传统计算方式通常是单一的计算形式,例如只有云主机或者只有裸金属,计算资源难以共享和组合,灵活性和效率都较低。而云计算技术发展过程中,在多元算力领域提供了多种算力服务的集合,无论在云公有部署还是私有部署场景中,企业和组织都需要能够根据自身需求选择不同计算形式的云计算平台。

多元算力发展迅速

为云的私有部署带来更高挑战

在两种主流的部署形态中,云的公有部署厂商在算力的多元性发展速度更快,有赖于公有云往往部署在由厂商自建或租借的数据中心,并由一支规模可观的专业团队负责开发与运维,因此具备持续平滑升级的能力,随着时间积累,为企业和客户提供满足不同场景的算力能力,具备较高的总体可用性。

但是,由于多元算力的逐步丰富,公有部署的云厂商在平台软件设计之初就没有考虑云私有部署的多元算力要求,只能通过裁剪一个公有版本私有部署并把其当成公有侧的一个延伸,满足部分算力的需求。

而云的私有部署场景中,多元算力出现了断代发展的现象,无论是虚拟化、超融合厂商还是在构建传统私有云,优势在于可以灵活按需部署,因为完全私有部署,数据安全性更好,总体 TCO 更优,但短板在于无法提供可持续发展的算力能力,大多以虚拟化、裸金属为主,因为传统虚拟化、私有云的架构采用的是整体式架构,通常采用围绕经典服务器虚拟化技术为主,所有进程紧密耦合,并被作为单项服务运行。

随着代码规模的增长,添加或改进整体式架构私有云的功能变得更加复杂。这种复杂性限制了平台能力扩展的可行性,能力无法进化, 当一种新型态算力需要增加到平台当中时,过于复杂的软件系统无法很好融入新技术、新框架,这使得大部分厂商不得不另起炉灶,为不同算力提供不同的软件产品,再通过软件与软件直接的堆叠、集成为客户提供多样的算力选择 ,这不灵活,也失去了多元算力按需选择的优势。

易捷行云 EasyStack(以下简称易捷行云) 在云计算软件架构设计中,着重考虑了私有部署与多元算力供给的场景,目标也是为云的私有部署带来与公有部署同样的多元算力能力。

设计可承载多元算力的底层云计算架构

将云原生理念与可进化融入系统的构建

易捷行云数字原生引擎 EOS 是构建在 Kubernetes 上的稳定、可靠、安全的数据中心操作系统。数字原生引擎 EOS 采用微内核架构,具备安全沙箱能力,面向故障设计,兼容异构指令集架构,通过内核与用户态分离,对于硬件资源进行统一抽象,向上统一的设备与资源管理。

此外,数字原生引擎 EOS 提供事件网格总线,将基础设施事件以 API 的方式提供给上层服务,反向提供服务与应用的统一调度。这些核心的设计理念的目标是能够为云提供包括一云多芯,全栈全平面的升级进化,不同指令集不同形态的算力统一编排与调度,全平面高可用以及更高性能的基础设施能力。

数字原生引擎 EOS 的设计目标之一就是提供满足不同应用场景和需求的算力能力,包括基础的云主机、裸金属、容器、GPU 计算、以及 serverless 计算能力,为微服务、分布式、高性能、AI 软件和应用提供适合的算力基础。

同时,数字原生引擎 EOS 也融入了云原生领域中的关键组件与设计模式,并同时提供适配多元算力的统一的软件定义存储、软件定义网络、监控、日志等系统服务,使得这些不同形式的计算资源可以互相配合,灵活组合与调度,提高整体资源的利用率,也更加适合云私有部署场景对于算力的需求。

易捷行云产品的核心是数字原生引擎 EOS ,数字原生引擎抽象出声明式数字原生引擎原语,数字原生引擎原语使易捷行云总体平台自身采用 Low Code Event Driven Architecture 以编排的方式进行构建,这样做不仅仅使易捷行云云平台自身极其灵活、极具弹性,同时顺带的结果是可以使所支撑的企业核心业务通过这项设计获取全栈全场景编排能力,通过云平台东西向与南北向以及所支撑的企业核心业务全栈全平面全场景可编排,企业核心业务与云平台的关系在逻辑上是一体,但是互相无侵入,又是逐层分离(逻辑一体,物理分离),从而能够更好的随需应变应对数字化挑战。

设计能够私有部署并持续进化的产品

实现更灵活的云私有部署算力架构设计

数字原生引擎 EOS 使易捷行云在部署形态(从起步规模到超大规模)与部署场景(从边缘部署、中心部署到多云部署)上更加灵活与便捷, 灵活的部署形态和多样的部署场景这两项能力能够帮助客户在更好的利用云计算技术进入数字化时代提供了有力的支撑。

数字原生引擎 EOS 解藕了平台与云服务,两者的分离不仅仅是计算机工业过去几十年中的最佳实践(建立标准从而使运行、支撑与业务分离)在云计算技术中的运用,更重要的是,两者的分离使云平台彻底解决了(在私有部署场景中)建设周期结束那一刻即是平台能力边界终点的短板,而这项能力能够更好的帮助客户应对在数字化转型过程中对云计算技术千变万化的需求。

易捷行云新一代云平台产品部署并不需要客户数据中心提供远程连接能力以满足运维、升级以及缺陷修复的要求。能够做到这一点,是因为易捷行云新一代云平台具备全栈全平面在线与离线 OTA 的能力,意味着,新的能力的交付也通过 OTA 进行,而这一点是能够充分释放易捷行云新一代云平台创新架构的核心,从而最大化体现云计算能够对客户所带来价值的关键。

OTA 的设计目标之一利用数字原生引擎 EOS 在架构上的优势,打通开源生态技术与云的私有部署间无形的壁垒,为未来更加多样的算力建立基础。 OTA 服务贯穿在系统的底座与云产品中,由于我们需要持续为私有云计算软件增加新的产品与服务,如何能够保证客户能够持续通过已经构建好的云计算平台持续获取新能力,而不是持续的购买一套又一套的软件,OTA 可以推送合适的、多样的算力产品与服务到环境中供平台规划设计使用。

那么,我们还有一个问题也需要关注,多样的产品与服务如果每次都是一个完整的软件版本,在工程上,软件的维护成本与复杂度会随着产品与服务的丰富成指数级上升,而通用的能力得不到沉淀,而基于数字原生引擎 EOS 解藕了平台与云服务的架构设计之上,结合 OTA 的加持才能够真正解决底座不断升级,平台能力不断进化的问题。

云计算技术与传统技术最大的区别在于,云计算技术并没有固定的一种技术实现手段、部署形态与能力边界,随着时间推移和以开源生态为基础的创新速度越来越快,云计算技术的演化速度也越来越快,因此部署在客户数据中心的云平台需要具备可进化的能力来应对这一挑战,同时,可持续进化的技术带来的价值是,即使是用户已经部署了的云平台,仍然具备持续进化能力,能够按需获取不同类型的算力服务。

通过多元算力为核心的云产品组合

按需构建新一代云平台

易捷行云新一代云平台产品中提供包括裸金属、云主机、K8S 容器集群、多种容器运行时,搭配容量型与高性能云存储,统一的多 VPC SDN 网络,以及统一的监控/日志/运维服务,这些服务可以按需组合, 基于平台与云服务分离的设计,在易捷行云全栈云平台首次安装部署以后,用户仍然可以持续不断的以所见即所得(What you see is what you get)的方式按需(Pay as you go)获取新的云服务。

通过统一的数字原生引擎 EOS 与多样的云产品组合,灵活满足从中小规模到超大规模云私有部署建设目标。企业和组织无论是新建设既可以建设以虚拟化、裸金属算力为主的云基础设施,也可以兼顾云原生/AI的需求按需扩展云原生编排能力、云原生算力、GPU 算力等能力,无需采购多套平台多套软件。

同时,数字原生引擎 EOS 的设计中采用了云原生为核心的设计理念,与企业和组织能够持续协同发展面向未来的数字原生基础设施建设,平台建设完成仍然能够持续向前演进,在此基础上,系统以一种低成本、无侵入的方式(Low Code)来编排、组合云平台的基础能力 , 能够以更加标准化、模块化的方式形成多元算力的构建单元,更加适用于对云计算平台的标准化、安全性、行业的合规与政策等有更高要求的行业。

作为专业的云计算厂商,以上在云计算产品架构设计上的多重考量,目标是能够去寻找一个正确建设云计算平台的方式—基于开源生态的可进化的云计算建设方式,满足当下基础架构云原生创新升级,虚拟化、信创创新替换,大规模新核心应用云基础设施的要求。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

X社区推广