ORACLE官方数据仓库案例–淘宝网数据仓库(转载)

成立于2003年的淘宝网稳踞亚洲购物网站的第一名,会员数超过4000万人,每年成交额皆以倍数快速成长,在2006年就已突破169亿人民币。随着业绩的持续攀升,以及同步成长的惊人数据量,淘宝网希望能从中挖掘出有用的信息,做为业务决策与网站运营的依据,因此,决定投资建置数据仓库。 淘宝...显示全部
成立于2003年的淘宝网稳踞亚洲购物网站的第一名,会员数超过4000万人,每年成交额皆以倍数快速成长,在2006年就已突破169亿人民币。随着业绩的持续攀升,以及同步成长的惊人数据量,淘宝网希望能从中挖掘出有用的信息,做为业务决策与网站运营的依据,因此,决定投资建置数据仓库。

淘宝网以Oracle网格运算(Grid Computing)技术重新打造并强化基础架构环境,再进行数据仓库的建置,短短半年之内就完成上线工作。淘宝网表示:「数据仓库的效益,在于分析历史、预测将来,以及看到所有活动的历史轨迹。它同时也是最佳指针,有效规范最终决策,不致太过偏离现实。

挑战
业务面与技术面的双重需求

淘宝网所面临的挑战,分别来自业务面与技术面。就业务面来看,如何设计出更多且更好的行销活动,以吸引更多客户,正是首要的业务目标。

而在技术面,基础架构的提升及强化将是关键。淘宝网甫于2003年成立,就连年以倍数快速成长,对于延展性的需求特别高;但另一方面,基础架构的建置仍缺乏整体且完善的规划与考量,则是主要的隐忧。

截至目前为止,淘宝网所累积的数据量已达10 TB之多,而且,这个数字还会随着每年翻倍成长的成交额同步上升。但庞大的数据量与计算量,已超出原有环境的负荷,进而对数据库的运行速度造成显著的影响。

淘宝网说明,原有的数据库虽然只使用了二、三年,但由于数据量成长的很快,再加上今年激活了许多新项目,对于数据库的要求也相对提高。因此,建置数据仓库时,最大的技术挑战将在于效率及速度。

效益
添增商业智能与数据挖掘功能,运行效能提升超过两倍

淘宝网的数据仓库主要提供商业智能(Business Intelligence)分析与数据挖掘(Data Mining)两大功能,同时,也会根据业务需求,提供所需的企业级报表,或进行用户行为模式分析。

淘宝网表示:「高达八成的员工都会使用数据仓库系统,无论是财务、巿场、服务或网站运营,同样必须每天看报表、做分析。而在主管方面,则是生成报表之后,再以电子邮件寄发。

举例来说,针对「十一长假」,淘宝网设计了许多促销活动上线,要确认活动是否达到预期目标,就要靠数据仓库来计算及分析活动的效果。此外,巿场部门也能根据往年的历史数据,找出效果最好的活动并重新包装推出。收起
参与67

返回hikaru_2003的回答

“答”则兼济天下,请您为题主分忧!
hikaru_2003hikaru_2003BI系统架构师海尔集团
早就不是oracle了,换成greenplum了,数据量也是PB级了
机械装备 · 2011-11-22
浏览394

回答者

hikaru_2003
BI系统架构师海尔集团
擅长领域: 大数据商业智能

hikaru_2003 最近回答过的问题

回答状态

  • 发布时间:2011-11-22
  • 关注会员:0 人
  • 回答浏览:394
  • X社区推广