开源商业智能: 一场平静的革命

在现有的经济环境下,企业需要审查和精简所有与企业软件相关的费用。 一个直接的结果就是,开源商业智能(BI)软件正在成为新的和现有的商业智能(BI)实施的一个重要的替代方案。 尽管大多数分析研究显示人们可能低估了这个技术演化趋势,但是开源商业智能(BI)软件正在蓬勃地发展。 研...显示全部
在现有的经济环境下,企业需要审查和精简所有与企业软件相关的费用。 一个直接的结果就是,开源商业智能(BI)软件正在成为新的和现有的商业智能(BI)实施的一个重要的替代方案。 尽管大多数分析研究显示人们可能低估了这个技术演化趋势,但是开源商业智能(BI)软件正在蓬勃地发展。 研究证明,开源商业智能(BI)解决方案已能够补充传统商业智能环境的不足,并与之很好地集成在一起。 开源商业智能(BI)供应商具备十分有竞争力的技术实力,并在节省费用方面有无可争议的优势。

人们通常认为“开源软件”是“可免费访问源代码”的软件。事实上,开源软件涵盖的范围很广。 开源软件授权(通常又被称为开放版权[copyleft])须遵守开源代码促进会(OSI)定义的规则——该规则规定开源软件不锁定用户或技术,且允许使用者对源代码任意散布。

使用者可修改开源软件,但修改后的授权条款散布是有条件的(比如:授权条款可能要求以补丁文件而不是与原始代码集成的方式发布修改),其目的是保护作者原著的完整性。 最著名的开源软件包是LAMP解决方案,包括Linux操作系统,Apache超文本传输协议(HTTP)服务器,MySQL数据库管理系统,和PHP、Perl和Python等编程语言。

开源软件和商业智能: 相同的思路

“开源应用系统”是指使用开源软件技术搭建框架或库的软件系统。 由于开放版权(copyleft)许可不允许转售通过开源软件技术开发的软件,双重许可(dual-license)模式等机制应运而生。在这些机制下,商业软件供应商在交付软件时,既遵循了开源软件的许可声明,同时还可提供须支付附加费用才可获得的商业许可证。 软件供应商还可要求用户支付其他费用,如:支持、培训、咨询和高级功能等。

在过去的几年中,商业开源软件供应商一直致力于在企业应用系统领域确立长期的合作地位。 2007年2月,开放解决方案联盟(OSA)成立。除了把开源软件供应商团结在一起,该联盟的主要宗旨还有拓展开源应用系统的范畴,以及促进它们之间的互用性。 JasperSoft,一个开发开源商业智能系统的先锋,也是该联盟的创始者之一。 Pentaho,另一个开源商业智能软件供应商,已通过一系列的举措脱颖而出:领导和发起核心项目;实施开源行业标准;以及与数据仓库技术供应商(InfoBright 和 ParAccel 等)建立合作伙伴关系等。

与其他企业软件系统相比,商业智能系统须克服一些十分艰巨的技术问题。 这些技术挑战包括:超大型数据库的设计;多个不同数据源之间的复杂集成;应对过量信息的搜索能力;非常严格的性能和潜伏要求。 即使是开发有专利权的软件解决方案,企业都需要一支经验丰富的专业团队(包括数据库管理员、商业分析师和程序员等),才能实施和支持数据仓库和商业智能环境。

从这个角度说,开源商业智能软件已领先一步: 它鼓励软件供应商根据其需要使用和修改软件,并与开源社区中的其他人共享进步。 开源和商业智能技术的交汇似乎再自然不过了。 当您采用开源商业智能系统时,别忘了一个重要的因素。那就是,虽然该解决方案的隐含技术通常是开源软件本身,但是为了谨慎起见,您最好还是确定您的技术团队具备必要的技能。 例如,大多数开源商业智能软件基于LAMP解决方案搭建。 为了实施和维护该系统,技术团队须具备使用LAMP解决方案的开发和管理技能。

Pentaho: 一个最好的例子

开源商业智能(BI)系统可为企业提供成熟的商业智能解决方案。其能力从Pentaho平台在BI数据集成、报告和分析方面的卓越表现可见一斑。

元数据驱动的ETL工具

Pentaho的商业智能平台支持通用数据仓库元模型(CWM)规范。 Informatica等专利软件商都已实施通用数据仓库元模型(CWM)规范。该规范采用基于XML的元数据交换(XMI)作为交换数据仓库元数据的标准格式。 这就意味着在实施该接口的工具之间迁移映射。 Pentaho的抽取、转换和加载(ETL)系统基于元数据驱动的ETL工具(Kettle)。 Kettle(Kettle ETTL Environment)中的ETTL是数据“抽取、转换、传输和加载”过程的英文首字母缩写。 ETL系统支持: 各种不同的步骤(一个步骤代表数据转换过程中的最小单位;当数据行从来源系统向目标系统传输时,一个步骤包含适用于每个数据行的预定义或自定义逻辑);渐变维度(SCDs);大量数据源的连接器(通过Java数据库连接[JDBC]访问专利数据库,如:Microsoft SQL Server 和 Oracle 等);本地和远程执行作业和制定进度计划。 JavaScript Script脚本程序和Java技术使开发人员可以在转换过程的任意步骤中添加自定义码。

现在,企业面临的两个重大挑战是数据容量和潜伏要求。 为了支持大容量数据环境,Pentaho推出了一款可与数据库分区技术共同使用的集群解决方案(该解决方案使用多个节点或计算实体,以实现高性能和可用性);通过使用从属服务器(使用主服务器发送的信息来执行特定任务的一组服务器)来分散CPU和输入/输出(I/O)负载,从而改善系统性能。 但是,该解决方案不支持基于数据集成的变化数据捕获(CDC)技术。当数据源发生变化时,数据集成功能会触发数据传送。 通过读取交易日志来识别数据源的变化;开源数据库是个例外,因为交易日志读写器通常不是开源软件。收起
参与9

返回mel_grains的回答

“答”则兼济天下,请您为题主分忧!
mel_grainsmel_grains经理SDFS
开源...有待发展...
IT分销/经销 · 2010-03-02
浏览1450

回答者

mel_grains
经理SDFS

mel_grains 最近回答过的问题

回答状态

  • 发布时间:2010-03-02
  • 关注会员:0 人
  • 回答浏览:1450
  • X社区推广