商业智能技术:企业保持领先的关键环节

1 引 言

  无论是国内市场还是国外市场,各个行业都面对着激烈的竞争,正确、及时的决策是企业生存与发展的重要环节。越来越多的企事业管理层认识到,只有靠充分利用、发掘其现有数据,才能实现更大的效益。随着信息技术的发展和不同业务的普遍应用,产生了大量富有价值的电子数据,如制造企业里有生产制造、库存、销售、财务等,电信企业有客户数据、计费数据、网管数据、企业管理数据等,政府部门有交通、卫生、教育、税收等,如何将这些数据转化为企业决策所需的信息,是企事业单位面临的迫切课题。在信息技术领域,蓬勃发展的商业智能(BI,Business Intelligence)技术正是解决这些难题的金钥匙。BI技术采用数据仓库构建汇总数据的基础,进而支持数据发掘、多维数据分析等当今尖端技术及传统的查询及报表功能。大量的调查研究表明,采用BI技术是国际成功企业在各个行业的激烈竞争中保持领先的极为重要的一环。

  2 商业智能概念

  作为一种将数据转变为信息、信息转变成知识的工具,商业智能在全球一直享有较高的声誉。商业智能概念最早由IBM公司在1998年提出,在2000年2月,IBM围绕商业智能正式推出了一项企业级的启动计划。如今,它已经在电子商务、客户关系管理、信息门户、ERP及其它各类企业应用系统中担当起核心技术的角色。

  那么什么是商业智能呢?简而言之,它是能够帮助用户对自身业务经营做出科学决策的工具。商业智能充分利用现有的业务信息,借助现代信息技术,提取和组织有用的信息,帮助用户在加强管理、促进运销和企业发展方面做出及时、正确的决策,把握、分析和发现新的商机。

  IDC将商业智能定义为下列软件工具的集合:

  * 终端用户查询和报告工具。专门用来支持初级用户的原始数据访问,不包括适用于专业人士的成品报告生成工具;

  * 联机分析处理(OLAP,On-line Analytical Processing)工具。提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析。OLAP也被称为多维分析;

  * 数据挖掘(Data Mining)软件。使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断,

  * 数据集市(Data Mart)和数据仓库(Data Warehouse)产品。包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型;

  * 主管信息系统(IIS,Executive Information System)

  企业机构利用上述软件工具在统的BI平台上建立所需的企业范围内的商业分析。

  从系统的观点来看,商业智能的过程是从不同的数据源收集的数据中提取有用的数据,对数据进行清理以保证数据的正确性,将数据经转换、重构后存人数据仓库或数据集市(这时数据变为信息),然后寻找合适的查询和分析工具、数据挖掘工具、在线分析工具(OLAP)对信息进行处理(这时信息变为辅助决策的知识),最后将知识呈现干用户面前,转变为决策。

  3 商业智能解决方案

  IDC将商业智能解决方案定义为帮助企业跟踪、分析、模拟和预测他们自己的业务过程以及他们的客户、供应商和合作伙伴关系的解决方案。从技术架构来讲,商业智能系统上要由数据仓库系统、数据源、商业智能应用和元数据几个部分组成。

  3.1 数据仓库系统

  数据仓库系统是商业智能应用的核心,它是整个系统存储和管理数据和信息的地方。许多基木报表可以由它生成,但它更大的用处是作为进一步分析的数据源。数据仓库系统可以分为以下几个部分:

  数据抽取、转换和装载:负责将数据从业务系统或外部系统中获得、转换和处理成数据仓库需要的格式和形态,并在规定的时间装入到数据仓库中去。通常把这3个具体的步骤统称为ETL,在系统实现时一般采用数据抽取工具和应用编程实现,并拥有调度管理和控制功能。

  数据仓库(DW):是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程。多维分析和数据挖掘是最常听到的例子,数据仓库能供给他们所需要的、整齐一致的数据。数据仓库是数据存储核心,目前,大多数数据仓库采用关系型数据库管理。由于数据量的庞大和查询复杂的特点,在系统配置上强调大规模并行处理和针对决策支持访问的专项优化。

  操作数据:近年来,随着商业智能应用的需求,如数据挖掘和实时业务分析,在数据仓库中需要有部分数据拥有当前数据的特征,根据业务系统的变化而变化,不必关心历史信息,同时又拥有数据仓库数据面向主题的特点。这部分数据叫做操作数据,一般采用关系数据库存储,规模适中,强调快速查询响应能力。

  数据集中:存储了由数据仓库来的,经过裁剪和归整的数据,这些数据针对某个业务部门或某种业务分析应用而建立。数据集市一般都对数据进行了各种层次的汇总,井建立多维分析的模型,同时也包括了数据采样。数据集市的存储主要有关系数据库和多维数据库。其中,多维数据库存放多维分析数据,而关系数据库则存储星型模式。

  数据归整:指数据从数据仓库到数据集市的过程,它是数据仓库系统内部的数据处理和转换的过程,主要的任务是多维模型的转换、数据的汇总和采样等。有时,它由ETL系统统一调度完成。

  3.2 数据源

  数据源包括了现有企业中所有的信息系统,以及根据决策分析需求可能涉及的其它外部数据资源。它主要包括业务数据和外部数据。

  3.3 商业智能应用

  商业智能应用涉及数据和信息的展现部分,它是用户使用商业智能系统的界面。目前的商业智能系统一般提供以下的功能,查询和报表、联机分析处理(OLAP),数据挖掘和数据统计及商业应用。

  3.4 元数据

  所谓元数据就是管理商业智能系统的数据,是关于数据的数据,是以概念、主题、集团或层次等形式建立的信息结构,并且记录数据对象的位置。其内容贯穿了商业智能应用的各阶段,记录着从ETL到分析展现各个阶段和各组成部分的管理信息。在系统管理上,试图提供统一的平台对元数据进行管理和维护,并通过元数据的状态驱动系统各部分的运转。不过,就目前而言,元数据的概念在数据仓库业界尚未拥有一个统一的标准,各个数据仓库厂商的产品间元数据也是不能够互通的。
参与4

0同行回答

“答”则兼济天下,请您为题主分忧!
西溪南西溪南软件开发工程师666666
支持下显示全部
支持下收起
互联网服务 · 2010-02-09
浏览782
6 商业智能应用的建议  商业智能应用的建设是一个经验积累的过程。面对用户面临的各种问题,可以对用户在观念与设计思路、技术实现关键问题及人员的主动性等方面提出如下建议:  6.1 观念与设计思路的转变  首先,用户要采用从战略上藐视、战术上重视的观念,突破商业智能...显示全部
6 商业智能应用的建议

  商业智能应用的建设是一个经验积累的过程。面对用户面临的各种问题,可以对用户在观念与设计思路、技术实现关键问题及人员的主动性等方面提出如下建议:

  6.1 观念与设计思路的转变

  首先,用户要采用从战略上藐视、战术上重视的观念,突破商业智能应用神秘化的思想,只不过将它作为另一种类型应用;其次商业智能应用要满足多层次应用的需求;反对将系统简单归为“一把手”工程,尽量降低系统建设过程中非技术的影响因素;要注重激发量化科学管理的积极性,根据应用的实际需要,规划商业智能应用,从对数据的使用程度和应用的部署两个方面可以将商业智能系统分为战略性的用途和战术性的用途。所谓战术性指面向局部的,解决特定问题的方案,而战略性指面向全局的,解决整个企业管理问题的方案。

  6.2 技术实现关键

  数据模型设计关注业务流程而非业务部门或应用。目前,业界较为流行的误区是将数据仓库的设计根据业务部门或应用功能进行划分。在数据仓库的设计中我们会经常见到“大客户分析”、“客户行为分析”或“客户流失分析”等不同的应用主题。实际上,仔细研究各个应用,不难发现,它们均使用了同一个数据源——客户交易的数据。与其在不同的应用中建立客户交易的信息,不如在数据仓库中建立统一的客户交易信息提供多个分析应用使用。

  关注于业务的流程而非业务的部门或应用能够让我们更清晰、更经济地整合企业的信息。数据仓库的建模应根据业务的流程和数据源来决定。

  系统建设可分阶段实施、可持续发展。虽然数据仓库设计作为决策分析系统的主要部分将在设计阶段集中解决,但数据仓库的建设是一个系统工程,其中涉及的数据源也可能分散在各个部门,在系统实施过程中会遇到各种包括非技术因素在内的问题。因此,数据仓库的设计必须“大处着眼、小处着手”,数据仓库的建模必须提供系统可以分阶段实施、并在应用层面保持系统可持续发展。同时,每个阶段的建设必须注重投资回报、提供资源共享。

  注重数据的完整性。对干每一个数据仓库关心的数据源在数据仓库设计时都将从最明细的数据层次进行收集。即使将来的分析大部分都是基于汇总的数据,但数据仓库中最底层的数据模型将对应业务系统中最明细的部分。

  这样的设计,使得数据仓库的建模和数据采集对于业务系统来说是一步到位的。而这样设计出的分析模型是能够支持所有可能的业务分析的。不会因为数据仓库的设计而丢弃业务的细节,导致未来系统重建。

  尽量减小需求的变化对系统设计的影响。需求的变化导致数据仓库模型的变化。这个问题是数据仓库系统建设中非常关键的问题,有时会影响数据仓库建设的成败。需求的变化客观卜是不可避免的,一个好的数据仓库设计当然能够减少需求变化对模型的影响,但遵从一定的设计原则,则可以将这种影响降至最低。解决的方法有分层次的模型设计思想,各种具体设计原则和技巧应对可能发生的扩充和变化。

  6.3 集成商与用户的主动性至关重要

  来自集成商和最终用户两个方面的主动性是影响到商业智能应用的主要因素。

  以最终用户的主动性更为突出。因此,增强客户对商业智能系统实施的主动性是首要问题。

  其次,IT部门和业务部门的配合也非常关键。由此,业界有人提出建立BI促进中心的想法,在需要实施商业智能应用的企业,由IT部门和业务部门的代表,加上专业咨询顾问,共同建立一个企业商业智能应用促进中心,专门负责在整个企业范围内推广一商业智能应用,并负责评估应用结果,从而改进应用。

  7 商业智能的发展前景

  根据Gartner Croup的分析,从2001~2003年初,商业智能的技术处于较缓慢的发展时期;在技术上,新的创新和突破预计要在2003年下半年。从商业智能的应用发展来看,日前的发展是呈行业化和专业化。

  就目前而言,商业智能技术发展在系统各环节的表现如下:

  7.1 ETL部分和元数据管理

  在ETL环节,对多种数据源的访问,包括非关系型数据库和大型主机,成为基本的技术指标。新的发展点主要有:新的数据抽取系统都将XML纳入数据采集格式的范围;在数据分析上,越来越多的企业和机构要求其决策分析环境能够提供更为接近实时的数据分析,技术手段主要集中在ETL环节,交易日志的监控、数据的复制成为数据采集的手段。

  7.2 数据仓库

  今天,并行处理加决策支持优化的关系数据库系统仍是数据仓库领域的主角。大家普遍认为发展方向是在关系数据库基础上融合决策支持和事务处理的能力,不过这样的策略或许仍存有争议,毕竟有不少技术人员认为事务处理和决策分析对关系数据库来说有如鱼和熊掌,不能兼得。尽管如此,在关系数据库中加入OLAP能力、SQL语句中加入数据统计公式和算法正在被各厂商提供的产品中实施。

  7.3 分析展现

  商业智能系统的分析展现是技术发展较为活跃的部分。OLAP及其它商业智能的应用以Web服务形式提供,并与企业门户集成。OLAP和商业智能应用的前端的界面转化成瘦客户端的应用模式(浏览器、Intranet模式)已成为普及性的要求。以XML形式发放商业智能应用的分析结果是新的发展趋势。

  数据挖掘的模块、算法和工具将更多地融合到OLAP组件甚至数据仓库服务器系统中。同时,商业智能应用与企业门户、企业应用集成紧密相连。新的商业智能系统不再是一个孤立的应用,它与企业中的其它应用系统将紧密集成。

  从商业智能的应用来看,目前的发展是呈行业化和专业化。首先,商业智能系统将更具行业化的特点。笼统的商业智能系统渐渐成为概念,客户实际需要的系统则分为电信、银行、保险、制造业等各种领域,并且,每个行业有其关注的重点和分析的模型。

  其次,商业智能应用更加强调应用的集成。主要应用领域包括分析型CRM,客户关系管理和优化仍将是商业智能应用很重要的一块;服务于ERP系统的商业智能,传统的ERP厂商都在将商业智能应用或模块加入到他们的ERP系统中;与SCM集成的供应链管理优化。

  8 结束语

  应用商业智能技术并非是一成不变的模式。在全面了解商业智能技术的功能、应用要求的基础上,大型成熟企业和中小型企业就应当采取适合自身特点的不同模式,社会公用部门也要采取适合其使用的模式。无论是企业还是社会管理部门都应当将商业智能技术看作与传统业务自动化处理系统完全不同的系统,它是技术与业务管理紧密结合的产物,是企事业单位在信息爆炸时代使用信息技术的高级模式,它没有终止,只有不断深入的过程。收起
2010-02-09
浏览718
4.4 多维数据库模块  在分析各专业系统数据时,从不同的角度来审视业务的衡量数值是一种很自然的思考模式。例如考虑商品的销售额,有时需要比较不同商品在同一地区的销售额,有时需要比较同一商品在不同地区的销售额等。这种分析方式叫做“多维分析”,简言之,每一维即是一个分...显示全部
4.4 多维数据库模块

  在分析各专业系统数据时,从不同的角度来审视业务的衡量数值是一种很自然的思考模式。例如考虑商品的销售额,有时需要比较不同商品在同一地区的销售额,有时需要比较同一商品在不同地区的销售额等。这种分析方式叫做“多维分析”,简言之,每一维即是一个分析的角度。它的主要功能是根据用户所选择的分析角度,事先计算好一些辅助结构及每一维各层次所需的汇总,以便在查询时能尽快抽取到所要的记录,并快速地从一维转变到另一维。用户从而就可以在较短的时间内从各种不同的角度来审视其业务的经营情况。

  4.5 决策支持应用平台

  决策支持应用平台后端连接数据仓库模块,向决策支持系统用户提供OLAP分析、灵活查询、固定格式报表、灵活报表等不同层次的应用,满足电信业务人员多种多样的信息需求,促进企业决策的科学化。决策支持应用平台主要包括分析模块和报表模块等组成部分。

  (1)分析模块:是电信决策支持系统的主要数据展现和分析手段,企业用户通过客户端或浏览器与OLAP服务器连接,快速、一致、交互地访问各种可能的信息视图,洞察数据深处,掌握隐于其中的规律。分析模块能帮助企业中的决策人员、业务分析人员、数据分析人员完成各种OLAP需求。

  (2)报表模块:决策支持系统的总体需求中除对分析功能提出要求外,也对完成各种固定格式或灵活的报表提出了需求。报表模块根据电信企业的需要生成大量的企业内部使用或上报的规定格式报表,同时也可以根据需要生成用户临时要求的不同格式的报表。这些报表的数据来源多种多样,报表的复杂程度也各不相同。在报表生成周期上,既有年报、季报、月报、周报、日报等固定时间间隔的报表,也有一次性或临时生成的报表。

  4.6 数据挖掘模块

  数据挖掘又称为KDD(数据库中的知识发现),就是使用各种计算及分析方法(如聚类分析、预测分析等),从大量的数据中找寻数据与数据之间的关系。一个细心的决策人员,往往能从这些挖掘出来的关系得到意想不到的启示,从而帮助他在激烈的市场竞争中取得成功。

  除了聚类分析、关联分析、时间序列预测等算法以外,全国中心在系统建设过程中,针对Data Mining技术还尝试了决策树、回归分析、概念树等算法。

  通过系统的建设,全国中心在做好目前计费、结算、账务处理的同时,逐渐向电信运营商的数据集中处理(计算)中心的方向转型,承担收集、整理各类型企业数据,进行深度加工、处理和计算,抽取隐含信息,提供经营决策的第一手材料,促进决策科学化水平的提局。

  5 商业智能应用误区

  商业智能应用的规划、设计、开发、实施是一项相当复杂的系统工程。事实上,国内用户在发展商业智能应用的过程中确实遇到这样或那样的问题,这些问题有些涉及宏观的系统定位和应用发展理念,有些出于具体的实现步骤或技术,还有些是认识上的误区。

  5.1 系统需求和定位问题

  许多用户谈到商业智能系统需求的问题主要集中在应用需求的不明确(具体业务部门提不出需求)、不急迫;企业决策层对该类系统的用途及如何得到投资回报不清楚;系统建设复杂(不知该如何设计模型、存放什么信息)。这些问题实际上在某种程度上与东西方文化差异有关。

  5.2 系统反复、受非技术成份影响大

  商业智能系统的可持续发展力差、系统常被废弃而后又重建,造成资源浪费;技术和概念停滞不前,应用上不去;且受非技术的影响大。这是国内目前商业智能应用较普遍的问题。有些人说,商业智能系统是“一把手”工程;这表面上看是对商业智能系统的肯定,但实际上是一个误区。基于这样的概念建立的商业智能系统,功能的单是一定的,而且也是最容易遭受由于权力的更替而带来的灭顶之灾。

  事实上,商业智能系统的应用面在一个企业中是多层次的,其广泛程度超过任何一个业务处理系统,但前提条件是各部门业务人员和管理人员具有基干数据、统计和分析去指导决策和行动的工作习惯。

  5.3 平台和应用的问题

  国内企业对商业智能的需求一般是从具体的应用开始,如大客户管理系统、领导决策支持系统、经营分析系统、财务管理系统等。但这些应用的背后都需要数据仓库的支持。这样就引出了一个问题,是先开发应用还是先建立数据仓库平台。在平台和具体应用间有效平衡,将系统的建设可分阶段实施、一可持续发展是商业智能应用实施的关键。

  5.4 思维模式问题

  目前,国内企业商业智能系统实施过程中的一个主要的问题是带着明显的传统事务处理系统的思维模式。这种惯性的思维土要表现在系统的设计仍沿用传统生命周期的思想,根据需求、开发应用,但商业智能的应用需求往往复杂多变;在商业智能系统实施方法学上显得落后;对商业智能领域的技术发展趋势的厂解和把握还不足,在产品选型上对其技术路线和定位研究才、透彻,在数据仓库核心的选择上一般单纯地以性能为衡量指标,动辄大搞性能测试,既不全面也不专业,殊不知查询性能在商业智能系统中是最容易被满足的。商业智能仅是业务报表吗?许多企业会把实现现有业务报表的问题作为商业智能应用的开始,这虽然看起来是一条务实的途径,但实际上可以算是一个误区,其中隐藏着风险。企业领导每日看报表但并不关心报表从何而来。如果商业智能系统以报表起步,就必须向决策者解释这仅是最基础的功能。而我们的项目实施人员往往在这一点上很难与高层领导达成共识。因此,商业智能系统的建设必须满足报表,但更要超越报表,从一开始必须给企业的决策层感受到商业智能应用的威力。

  5.5 系统投资回报问题

  任何一个IT系统的建立都要讲究投资回报。整个商业智能应用的绝大部分时间都是在花钱,从数据的采集、数据仓库的存储、各种分析、挖掘的服务器和软件。而真正能够使商业智能应用赚钱的阶段则是因此得到正确的决策,并运用于企业的业务和市场。这是一个开环和闭环的问题。目前的国内企业,对闭环的问题考虑不多,即便有了决策支持系统,问题是这些决策能否有通畅的渠道得以实施。

  5.6 应用条件成熟度问题

  有不少对商业智能有需求的国内企业,其传统的事务处理系统仍不完善,如零售行业、一些制造企业和乡镇企业等。这在国外并不多见。但对国内企业来说,是否需要等到业务系统完善之后再考虑商业智能呢?实际上并不一定,因为市场竞争并不等人。数据采集的方式多种多样,即便是一个用笔和纸记录业务过程的机构,也可以通过扫描和识别将数据汇人数据仓库或数据集市,实现分析决策。同时,我们还应该有概率统计的概念,在无法获得全部完整数据的情况下,系统通过概率加权,依然能够提供足够准确的分析。收起
2010-02-09
浏览753
4 商业智能应用  在当今的商业环境中,市场竞争日益激烈,它促使企业和机构在信息系统的建设上不仅需要对业务流程的支持,同时需要从信息系统中获得从客户、营销、企业的运营状况到供应渠道的通畅与否等高层次的分析决策信息,并且将决策结果运用于日常业务以提高企业整体效益...显示全部
4 商业智能应用

  在当今的商业环境中,市场竞争日益激烈,它促使企业和机构在信息系统的建设上不仅需要对业务流程的支持,同时需要从信息系统中获得从客户、营销、企业的运营状况到供应渠道的通畅与否等高层次的分析决策信息,并且将决策结果运用于日常业务以提高企业整体效益。然而,传统的业务系统则是针对分离的事务处理而设计,并不擅长于多层次的分析和统计。由此,商业智能应用应运而生,它通常是一个独立的系统,能够从传统业务系统巾获取各类客户数据和业务数据,由此建立多层次的分析体系,并将其转化成有商业意义的信息。商业智能作为实现企业管理现代化的重要标志,是企业成功的关键,在各个行业都有着广泛的应用。

  电信行业:用于客户描述和定位及需求预测等方面。

  保险业:根据投保品种、投保人等历史数据,合理设定储备金数额、保险金标准,进行风险分析和损益判断,提供个性化保险服务。

  银行、金融和证券行业:分析客户收益,调整市场活动,建立信贷预警机制,进行更精确的组合业务评估。

  制造业:同一以在销售/营销方面采取更主动的行动以吸引客户,预测需求,及时订货和补货,实时了解供应商和代理商的情况,优化调度、配送和运输过程,实现低库存水平。

  目前随着电信市场开放、竞争的不断加剧,各大电信运营商都下大力气进行运营支撑系统建设,以保证企业核心竞争力方面的优势,最终确定在未来电信市场竞争过程中的有利地位。下边以某电信企业全国计费结算中心(以下简称全国中心)决策支持系统建设为例来说明商业智能在电信行业的应用。

  全国中心建设的决策支持系统包含数据模型管理模块、数据转移模块、数据仓库模块、决策支持应用平台等组成部分,下面分别介绍各个部分的功能。

  4.1 数据模型管理模块

  数据仓库和决策支持系统的性能、可用性和扩展能力与其模型设计质量具有紧密的联系。在需求分析定义、系统设计和详细设计阶段,需要在深入理解电信的业务流程和需求的基础上,将业务规则转换为逻辑模型,并逐渐细化为针对特定目标数据库的物理模型。

  数据仓库模型是决策支持系统中最主要的元数据类型之一,是数据仓库建库和管理、定义数据转移规则和流程及设计数据仓库和前端应用接口的重要依据。当需要对决策支持系统结构进行更改时,必须首先检查相应的数据模型是否需要变化及怎样变化,再对决策支持系统的其它模块进行修改。

  4.2 数据转移模块

  数据转移模块将原有各专业计费系统所提供的详细数据和外部数据源的数据按照数据仓库模型整合到数据仓库系统中去,在这个过程中需要完成数据的抽取、清洗、转换、整合、传输、加载等操作,是决策支持系统构建过程中最为复杂的一个环节。数据转移模块主要解决以下问题:

  (1)确定要抽取的元数据。这里主要从几个业务系统中抽取数据,如国际通信计费结算系统、骨干智能网计费系统、骨干IP网计费结算系统、各省国内长途集中计费系统、网间结算系统等。数据在经各专业系统完成相关处理的同时,经过相应的清洗、整理,进人决策支持系统的多维数据库转储;

  (2)确定如何抽取数据。抽取数据可以采用文件方式或数据库直接抽取两种方式,其中文件方式又可以分为主动文件抽取和被动文件抽取。开始阶段采用文件方式抽取数据,系统运行稳定后,可考虑采用数据库直接抽取方式;

  (3)确定抽取数据的频率和时间。抽取时间必须设置为业务系统不繁忙的时段。目前各专业数据抽取的频度基本上与相关业务系统处理的频度相同,只是将处理时间做适当的分离,避免内部生产网络出现较高负荷;

  (4)对来自不同数据源的数据进行一致性转换;

  (5)合并来自不同数据源的信息,去除重复性;

  (6)定义取值范围;

  (7)进行匹配和清除;

  (8)对同组或相关数据进行聚合或汇总计算;

  (9)将数据源中的单一信息按照数据仓库的需要进行分解;

  (10)对数据进行重组或重构;

  (11)统一计量单位;

  (12)将代码转换为完整的有实际意义的描述;

  (13)确定数据加载的目标数据库;

  (14)确定数据加载类型(批量装载、增量更新、原位更新、删除等);

  (15)对数据加载进行时间调度。

  4.3 数据仓库模块

  数据仓库模块包括如下3个数据存储部件:

  (l)分段存储区:为了保证数据移动的顺利进行而开设的阶段性数据存储空间,需要进入数据仓库的各专业系统数据首先直接快速传输到分段存储区,再从分段存储区经过清洗、转换、映射等复杂的数据移动处理转移到日标数据仓库中。从各专业系统到分段存储区的数据传输,尽量避免进行数据处理,以保证数据的快速导入,从而尽量减小对专业系统造成的压力。分段存储区的数据也可作为数据仓库系统的备份数据。

  在开始加载数据后,首先将各个系统的历史数据转移到数据仓库中,以后系统运行过程中就只需要定期增量加载数据。

  (2)基础数据仓库:基础数据仓库的数据直接来源于对分段存储区数据的抽取,但数据结构完全按照决策支持的需求而设计成星型结构(或雪花结构),在设计中兼顾系统未来的发展变化和数据查询、访问的效率。在抽取过程中,基础数据仓库对数据进行了完整性和有效性检查,对冗余和不一致的数据进行了清洗和转换。

  (3)数据集市:是数据仓库的子集,通常将详细数据聚合为汇总数据,其主要目的是支持各种不同的前端决策支持应用和其它业务系统的信息需求。数据集市的数据通过对基础数据仓库中数据的复制、分布或聚合而得到,数据结构设计为星型结构,可以直接支持通过ROLAP服务器的多维分析。

  收起
2010-02-09
浏览735

提问者

sunny
擅长领域: 商业智能大数据java

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2010-02-09
  • 关注会员:0 人
  • 问题浏览:2846
  • 最近回答:2010-02-09
  • X社区推广