Hadoop - 主题 - twt企业IT交流平台

Hadoop

Hadoop

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

882 会员关注

418 会员贡献

26 关系主题

问题

问题
热度排序 时间排序

互联网服务spark优化·2019-08-26

hadoop+spark 集群环境资源预估？

美国队长 · Alibaba　擅长领域：大数据, 大数据平台, 数据库

512 会员关注

可以先结合具体的业务场景，将数据按照时效性进行分类，如实时、准实时、离线，实时的数据从数据量层面去衡量内存的分配，CPU即线程数等，同时从成本上考虑对现有的数据进行压缩存放，具体的压缩策略可以结合具体场景衡量...

浏览3657

互联网服务hadoop hdp·2019-07-27

ambari的HADOOP集群，下SPARK2 HIVE HBASE等组件整合问题，类找不到？

美国队长 · Alibaba　擅长领域：大数据, 大数据平台, 数据库

512 会员关注

这个应该是版本的原因造成的，建议你到官网参照你是用的版本，然后根据错误提示guava版本看一下，版本号是否一致

浏览3022

融资租赁Hadoop·2019-07-24

问一下大家谁有hadoop以及openstack的搭建文档的呢？

匿名用户

这类文档在社区里面特别多，你可以直接搜索。ubuntu14.04上安装openstack的手册权威http://www.talkwithtrend.com/Document/detail/tid/122877OpenStack完整安装手册(CentOS6.2)http://www.talkwithtrend.com/Document/detail/tid/138099centos 安装配置 hadoop 超详细过...

浏览1770

工业制造其它Hadoop·2019-07-02

对于版本为2.0.x等较新版本的hbase，sqoop版本如何选择？

匿名用户

如果hadoop版本是2.2.0，对应的sqoop版本是：sqoop-1.99.3

浏览2400

银行大数据·2018-12-28

大数据平台加入到灾备怎么做？有成熟的思路或者方案吗？

sxtycxx · 人工智能（计算机视觉）　擅长领域：存储, 灾备, 服务器

520 会员关注

灾备解决的是业务连续性的问题，大数据平台本身提供多副本机制是保障业务的稳定和可靠运行的目前大数据平台基本是都是部署在虚拟机或是容器之上，很少有直接部署在物理服务器+存储架构之上这样虚拟化和容器本身就带来很强的业务连续性的功能，例如虚拟机的热迁移、HA、DRS等功...

浏览2208

银行大数据·2018-12-11

贵行使用的hadoop是哪家厂商的？

wuwenpin · 南京　擅长领域：服务器, 存储, 云计算

256 会员关注

大华为

浏览2732

银行大数据组件·2018-12-10

为满足关键特性系统的架构或组件选择是怎样的？

联盟成员

· 省农信社　擅长领域：大数据, 人工智能, 知识图谱

246 会员关注

1.可视化需要开发一个专门的知识图谱展示界面，将知识图谱中的实体、关系属性等以美观已操作的方式展示出来，因为颜值即正义。可以借用当前比较流行的bootstrap等前端开发语言。2.为满足快速查询，可以将部分索引关键字放在索引es中，索引命中后在使用key去titian中查询。3.多种...

浏览2380

软件开发大数据·2018-11-16

我们的代理接入hadoop组件hive时候报错undeclaredThrowableException？

青山松 · 传媒　擅长领域：服务器, AIX, Unix

326 会员关注

我看你的网站里有空格之类，增加引号试试 curl --negotiate -u : "http://主机ip:对应端口/templeton/v1/ddl/ database? user.name=hive/XXX&like=*"

浏览2440

银行Hadoop·2018-10-24

hadoop集群怎么做双活？

ZhuJun2014 · IBM　擅长领域：存储, 灾备, 双活

457 会员关注

通常而言，hadoop这样的集群用来跑大数据分析。这样的集群有两个特点，一个是数据可以从别处过来，另外一个是数据量很大。由于hadoop集群的数据不是OLTP类型做对外交易，因此没有做双活的必要性。另外，hadoop集群通常不用集中存储，因此存储层做双活，和hadoop就谈不上了。如果非要做...

浏览4601

工业制造其它大数据·2018-10-19

流程性行业质量大数据选什么方案好？

sxtycxx · 人工智能（计算机视觉）　擅长领域：存储, 灾备, 服务器

520 会员关注

1.如果是大数据项目，底层存储肯定不能用实时数据库+关系数据库这种架构，大数据底层必须是分布式架构，存储大多数都是采用HDFS分布式文件系统2.但是像你说的生产中的温度、电流等实时的工艺参数，最开始一直都是采用SCADA实时采集PLC和各类传感器设备的数据，存放在实时数据库（例...

浏览2588

描述

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

882 会员关注

418 会员贡献

26 关系主题

主题组织结构热门关系主题

关注330 大数据分析

关注590 大数据产品

关注分布式数据库产品

关注大数据平台涉及产品

关注22 GoldenDB

关注45 OceanBase

关注63 elasticsearch

关注 Informatic

关于TWT 使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们
© 2024talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30

X社区推广

关注主题882