个人理解,单从企业来讲大数据解决方案主要就是从2方面帮助生产营运:1,开源,增加收入。2,节流,节省成本。但是考虑到地铁本身的公益和社会服务属性,还需要加入安全管控的内容。
1,就开源来讲,其实目前中国的地铁公益属性决定了,地铁公司可能很难通过客票业务增加盈利,但是是否可以通过其他附加服务增加盈利点,这是值得考虑的。但目前业界上没有成功案例。
2,就节流来讲,地铁的车辆,信号系统,铁轨等都有大量的资产需要维护,如何通过大数据找寻资产维护的科学途径其实是大有可为的。这里我可以举一个案例:IBM软件部在南方某地铁公司针对车轮的旋削方案进行了考察。通过大数据方案,对车轮旋削前后的数据比较,以及时间间隔进行的分析。给出了全新的旋削策略。经模拟测试,新的策略可以将一对地铁车轮的生命周期延长30-50%。这意味着可以大大降低营运成本。
3,在安全管控方面,可以通过进站的时间和习惯分析,预测地铁的人流高峰出现的时间,规模。并基于此做出相应的安保措施。
综上所述,大数据分析在地铁行业中还是大有所为的,数据就在那里,关键看谁有慧眼能够沙里淘金。
个人认为归根结底还需要回到数据上来,现有的轨道交通体系内,有多少基础数据?相互是否存在关系?和哪些外部数据可以相互关联?这些数据能形成什么样的应用?面对这些应用集合,能实现什么业务目标?是否一定需要大数据?理清思路才是最根本的。
比如:设施设备的运维方面,完全可以依靠ITIL的管理思路推行,CMDB也好,案例知识库也好,都可以为运维提供支持,需要大数据吗?历史数据分析绝对不是大数据层面的应用。
大数据的应用应该对几种基础数据集合的应用,所以要走的第一步还是在理清基础数据、数据与数据的关系上,否则再好的手段、再好的技术,发挥的作用都是有限的。
收起关于产品的选型,我用过了TD、IBM的数据仓库产品,总体感觉Hadoop在技术上会逐步替代数据仓库,而且后期的扩容成本压力也小。
目前有Hadoop的商业版本,包括像IBM 的Biginsight等,可以尝试。目前我在一个项目上已经开始使用了。感觉基于Hadoop的产品,使用上局限更少一些。