Steven
作者Steven课题专家组·2023-01-29 13:47
IT顾问·steven

平台融合之数据融合

字数 4196阅读 791评论 0赞 4

基础设施平台融合之后按需为企业提供统一的基础设施资源服务,支撑业务系统对基础设施资源的敏捷部署、弹性扩缩容等需求。而数据越来越成为企业的核心资产,成为战略资源。数据只有被高效的利用起来,才能产生更大的价值,否则存储起来而不使用的数据是无法体现价值的。但现实面临的问题是传统单体系统建设思路使数据散落于不同的地方,虽然经过数据仓库、大数据平台等处理,依然无法充分发挥数据的潜在价值,同时也带来了巨大的成本支出和额外数据处理工作。数字化未来发展趋势,谁能拥有高质量的数据,并且能高效使用这些数据,谁就拥有了未来。

理想很丰满,现实很骨感。我们都知道数据很重要很有价值,可面前手能触及的却是一座座高山。由于传统系统建设往往是头疼医头、脚疼医脚,几乎没有全局性的系统建设思路,导致数据散落、重复、缺失、不规范,虽然有数仓、大数据平台、数据治理平台等花费了大量时间和精力,数据质量依然并不理想。是不是我们数据建设的思路一开始就是有问题的?

一、 传统数据建设思路

我们习惯于单体系统建设思维和数据集成、同步等方法,这也导致我们系统建设的越多,面对的数据问题越严重;然后引入了数据仓库技术、大数据技术、数据湖技术等,但这种加层的设计实现思路并没有带来便利,反而越来越复杂,使我们不得不面对众多的数据治理问题:

(一) 数据散落

几乎每个系统都需要保存数据,都需要相应的数据库或数据存储设备,这就导致数据散落于不同的数据存储设备或数据库。要实现数据的复用与共享,就需要数据集成,就得加层。

(二) 数据冗余

不同的系统所需的数据往往是交叉的,这就导致同样的数据需要保存在不同的数据库或数据存储中,比如客户数据,一个客户可能涉及到不同的业务,客户的信息就需要保存在不同的业务系统中,不仅导致数据的冗余,也导致数据不一致等问题。

(三) 数据同步

新上一个系统或服务,为了不影响原有的系统,就需要把一些数据导入到新的库表中,为了保持数据的有效,不得不定时或实时去做数据同步。多一个节点就会带来一层风险。数据同步往往难以实现实时,所以不同的业务展示给客户的数据可能是不一致的;同步操作也可能带来异常,导致数据错误、缺失等问题。

(四) 数据不一致

数据散落于不同的数据库或数据存储设备,数据冗余设计和数据同步操作等往往带来严重的数据不一致问题,从而导致低的数据质量,也严重影响着数据的高效使用。

(五) 数据缺失

聚焦于单体系统需求的设计往往难以从企业全局业务来考虑数据需求,在实际的数据维护过程中又往往忽视数据的完整性检查,导致一些数据无效或缺失,难以保证数据质量。

(六) 格式多样

不同单体系统往往来自于不同的软件厂商,有不同的设计思路和实现方式,数据定义名称、格式等往往不一样,在数据复用和共享时不得不加一层数据转换,不但带来额外成本,更使响应性能下降。

(七) 数据错误

我们往往关注后期的数据治理,花费大量的时间去加数据治理平台,而不是在数据产生的地方实现数据规范化和标准化,缺乏事前数据规划和事中数据校验,事后数据治理不但工作量成倍增加,更带来众多的数据错误、数据过期问题。

(八) 平台众多

为了解决已存在的问题,我们往往通过搭建新平台的方式来应对。数据仓库、大数据平台、数据湖等不断的建设并没有使我们的数据管理工作轻松,而数据冗余、数据错误、数据不一致、格式不统一、数据缺失等问题依然存在。

单体系统的建设思路只关注单体系统功能的累加,而缺失整体系统功能规划和定位,每个单体系统都在糅合有用和无用、重复和冗余的能力,比如大数据平台,关注的重点应该是数据的存储和数据处理,而不应该是去包揽和实现大数据应用。想从下做到上什么都做,只能做成相互隔离的单体系统或者庞大繁杂的垃圾堆,最后只能抛弃重来。因此从全局上、整体上规划和实现数据、数据平台的融合是以可持续发展的观点来适应可持续发展的要求。

二、 数据融合目的

简单的说数据融合目的就是解决单体系统建设方式下所带来的问题,实现唯一可信数据来源,为业务应用提供一致的、可信的、准确的、敏捷响应的高质量数据;认识到并关注数据产生的地方,以规范化、标准化贯穿数据生命周期过程,做好事前数据规划、事中数据校验、事后数据分析工作;融合业务应用、数据流程、数据库、数据仓库、大数据平台、数据治理平台等实现数据治理生产线,生产高质量数据;以主数据为骨架建设企业业务数据体系;构建数据中台服务以支撑业务服务和应用的敏捷构建,实现对业务需求的敏捷响应,从而实现真正的数字化转型,在数字化时代实现可持续发展。

三、 数据融合思路和方法

数据融合是从整体上、全局上看待企业数据资产化发展趋势和可持续发展之路,是从单体集成建设思路转变为平台融合建设思路。可采用整体 - 分层思路规划设计,以企业主数据为骨架构建企业数据体系,以微服务架构思想融合数据平台系统和工具,实现企业级 OneID 、 OneDataSource 能力和企业级 OneService 数据服务能力。

(一) 整体-分层思路

传统单体系统是竖井建设思路,而平台融合是以“整体上纵向分层、横向组件服务化”的思路来规划设计。我们认为企业在融合了各种平台和系统之后,从整体上看只有一个系统,这个系统分为若干层次,比如基础设施资源层、资源管理调度层、基础组件服务层、业务服务层、业务应用层等,每个层次由若干不同的组件以服务化的形式整合而成。以整体性系统建设思路来规划实施,各个组件之间以标准化服务进行交互,而数据以规范化的格式流转于各个服务、平台和各种业务流程之中。

数据融合包括企业内数据的整合和统一规范化管理,也包括数据平台的整合和融合。

(二) 主数据方法

主数据方法主要用来整合和融合企业内的数据。以企业主数据为支架构建企业级数据体系。习惯上我们可能不关注主数据,而通常采用数据仓库的主题域来进行数据建模,比如“人”可能会划分为“头”主题域、“上肢”主题域、“下肢”主题域、“胸腹”主题域等,这样设计虽然简化了数据模型,使各自聚焦于局部分析,但也往往造成了只见树木、不见森林或者盲人摸象的结果。而主数据的方法使“人”看起来是一个整体,是具备“头、上肢、下肢、胸腹”等的一个有机整体,看到的是一个“人”而不是“头”或“脚”,主数据体系就是支撑“人”的这样数据的一个完整骨架。

主数据方法可以抽取企业数据的核心数据实体和主题并使其有机的融合在一起,应该说是以更高维度来看待企业数据关系和数据价值。采用主数据方法首先要识别并抽取企业主数据,可以基于主数据管理系统的建设经验,以 CRM 等系统为切入点,识别并提取客户、账户等主数据逻辑模型,采用微服务架构实现中台数据服务,逐步替换、整合周边各个单体系统和数据。

(三) 微服务架构思想

主数据方法用来构建企业数据体系,而微服物架构思想则是支撑数据平台、数据服务、数据处理流程等融合的方法。

数据贯穿于整个企业活动流程中,每个人员、每个系统都在使用和生产数据。把每个系统、每个组件、每个参与者构建为类似以人为基本单位的人类社会的以微服务为基本单位的服务化体系,实现数据的有效和高效流转。

在整个数据生命周期过程中我们首先强调关注数据产生的地方,数据规范化、数据标准化贯穿数据生命周期过程,这样在后续数据处理过程中才能高效的存储数据、搜索数据和使用数据。数据通常来自于人工录入和系统自动生成,不管哪种生成方式,都要求进入数据流程之前成为企业规范化或标准化数据。也就是把数据治理工作提前,并贯穿于整个数据流程之中,应用数据治理思想于整个数据流程而不是单独去建设一个个数据治理平台。

微服务化可能使数据按照主数据模型、数据体量、数据安全级别等规划存储于不同的地方,可以方便的实现表分区、分表、分库、分介质存储等操作,而数据处理工具和平台也以服务化的形式应用到数据处理过程中,比如数据完整性校验、数据计算、数据脱敏、模型学习、关联分析、报表报告等等,都以组件微服务方式融合于企业业务应用流程中,使业务研发、分析、运维等人员更专注于业务应用创新和敏捷响应。

(四) OneID,OneDataSource,OneService

我们不得不再次强调 OneID 、 OneDataSource 、 OneService 设计思路。 OneID 其实强调的就是数据至少企业内全局唯一,而通过主数据则比较容易的构建全局唯一的数据体系,比如客户主数据,识别出客户主数据之后,以 CRM 或其他系统为依托定义客户主数据属性,在逐步融合周边及各个系统的过程中,完善客户主数据内容,比如客户可能需要划分为机构客户和个人客户,因为机构业务和个人业务有很大不同,其属性也差别很大,分开则在实际业务处理过程无论管理和数据处理都相对简化和便利。

OneDataSource 则是建立唯一可信数据来源。微服务化使数据可以不局限于一个大数据仓库或者大数据平台甚至数据湖,而是可以分类存放于不同的地方,比如客户数据可以存在 mysql 数据库,账户数据可以存在 postgreSQL 库,语音图像可以存在大数据平台,通过中间数据组件服务进行实时或定时处理,比如数据统计,日统计在日结时完成,同时更新月度统计、年度统计等,基础数据是不变的,而过程数据和结果数据是不断更新的,但数据来源都只有唯一的,保证数据始终是一致的。即便运行过程中有临时的异常和错误,也会在下一次的运行中被更正。

OneService 是以微服务架构构建单一数据服务或组件服务。服务是可以弹性伸缩的或扩展的,以支撑不同的并发请求和流量,来源于同一个数据源的服务也可能有多个,分别面对不同的业务维度需求,或者多数据源通过服务层的数据处理构建新的服务,以满足复杂数据处理需求。但同样的需求使用同一个服务,来自于相同的数据源。比如客户资产,可能来自于存款、股票、基金、理财、贵金属、债券等等不同的业务,也包括不同资产每日收益和在途资金等数据。这可能是一个复杂的数据处理服务,不过通过主数据和微服务思路,实现起来也并不困难。

四、 数据平台支撑中台数据服务

基于数据融合的思路和方法,数据平台就不再是一个个独立的单体竖井,而是融合在一起的有机整体。数据平台去粗存精微服务化,真正实现中间件服务的复用和共享价值。通过数据融合,中台数据服务也就水到渠成,构建起企业快速响应业务变化需求的能力,也就实现了以平台支撑中台的理念。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

4

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广