结构化和非结构化将长期并存,非结构化还有很多需求并没有实现,比如说事务,高实时性(虽然两者都有对应的解决方案)。结构化不是说一定要转向非结构化,没有最好的架构,只有最合适的架构。银行业的话,现在有app展示和apm监控有用到mongodb...
赞同,对待不同的数据类型,要实现分而治之,才能充分发挥硬件平台的优势。针对各业务系统所产生的不同数据类型,采用分布式或集中式的存储方式,解决数据存储中存在的性能瓶颈。
结构化数据可以考虑闪存存储非结构数据可以考虑使用对象存储
首先hadoop对于小批量的数据查询并没有优势,所以对于大批数据处理还是放在hadoop中,关系型数据库对简单的查询还是可以的,所以我的建议是利用hadoop对大数据进行处理,然后处理结果同步到关系型数据库如oracle或者mysql,数据同步用阿里的开源神器Datax...
http://www.aixchina.net/Question/226867-1378885
支持的Linux: RedHat, SuSE and Ubuntu。支持的DB:Oracle, DB2LUW, MariaDB, MongoDB, PostgreSQL上述数据库系统支持的数据类型在LinuxONE都很好地支持。甚至是非数据库格式的非结构化数据在LinuxONE上的表现更好,因为LinuxONE自身的架构、带宽和数据吞吐能力等非常强,可以...
结构化数据,可以考虑ibm svc+flashsystem的方式,热点数据自动easy tier至闪存上,非热点数据放在普通盘上,既保证性能又保证资产价值。非结构化数据,可以考虑IBM 的 gpfs,属于海量数据存储方案,如影像数据,可在线不断增加空间,属于PB级方案。...
我觉得应该是用闪存存储结构化数据快于存非结构化数据,因为闪存的优势是高IOPS和低延时,闪存的适用场景是随机或连续的小IO类型的数据,针对高并发、实时数据统计、分析之类的业务使用的, 而非结构化数据一般都是文件、图片...
对于大数据的今天,我们一直致力于解决非结构化与结构化数据的转换工作,那其实形式的结构数据都会通过我们自定义的ETL工具统一清洗与分析,所以,结构化与分结构化数据本身在Hadoop集群上的存储都已不是问题,主要还是看我们对数据的应用场景罢了。...
现有的数据仓库完全可以和大数据平台进行整合,现有数据仓库可以作为大数据平台的一个数据源和数据应用。正如问题中描述,对于金融银行业,往往已经实施有数据仓库,这个时候如果盲目上大数据平台进行平台替换往往容易造成数据混乱,所以我们提供的建议是混搭先行,逐步替换,先替换那...