稳定,性能,维护成本
权限控制应该问题不大,至少金仓是的
国产数据库这边用过金仓,学习成本还是比较高的,因为这是收钱的数据库所以网上资料比较少,之前一出问题就找金仓的维护人员来排查
好不好是相对的,不是绝对的,对于数据库厂商来讲为了快速变现,所以将一个基本能用的数据库上线;但是数据库到各个项目之后,各个项目的特性问题会直接暴露数据库的问题,这样就需要数据库厂商一直修改bug,导致 频繁升级 ,所以
mapreduce是计算框架,分map端和reduce端,主要用于分布式计算,hive是可以用来冗余数据(本质还是将数据存储在文件系统),使用hive的时候需要设计好数据模型,使用hive的好处是可以使用sql,但是如果sql里面有聚合函数,框架会将sql
那要看你们公司以后会不会有大量的数据存在,如果数据一直不会很多就没必要,如果可能会很多,可以搭建一个平台,不用太大只需要几个节点就行了,顺便可以熟悉一下技术
UDF、UDAF和UDTF,一般UDF比较常用 使用的时候需要将数据集转换为spark dataframe
这个是可以共存的,你需要那部分数据,就查询什么就行了,你需要实时的hadoop分析的数据,你直接调用对应的接口查询hadoop就行了,你需要普通数据库里面的数据,直接查询普通数据库就行了,
数据存储到hadoop以后,使用这些数据的时候,你要考虑使用那些组件,hive hbase等,数据建模要做好,
hadoop没有事物这一块。还有就是小数据量的查询效率没有普通数据库好,其实数据如果不是很多,不建议使用hadoop
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024 talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30