大数据分析
大数据分析
该主题还没有描述

问题

医院大数据分析·2017-08-01
解志 · 电子云 擅长领域:存储, 灾备, 软件定义存储
193 会员关注
如果经济运行可以进行尝试,IBM的waston就是最近大力推广。可以根据病人的病历的一些数据进行大数据分析,主要是一些数据的建模,比如感冒,如果感冒可以有哪些特征?如咳嗽,流鼻涕,可以根据这些特点就能分析出来,大病像癌症,如占位性的一些特点来分析...
软件开发大数据·2017-07-27
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
市面上再好的教材也没有自己动手去写,我建议你看学习视频,然后找例子去模仿,然后去了解例子的代码意思,循环迭代,就会进入角色
银行大数据·2017-07-27
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
587 会员关注
当遇到海量数据需要存储和分析时,都可能会用到大数据产品,因为大数据产品最重要的特点就是分布式,效率高,且每一款产品都针对特定应用场景,如hbase、spark、hive等
银行大数据·2017-07-27
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
587 会员关注
1、首次用Hadoop生态圈内的各个组件,最困难的是使用模式的转变,不像SQL一统天下的传统数据看那么容易上手。2、面对分布式引擎,遇到问题没有办法排查,因为你根本不知道你的程序在那里执行以及执行到哪里了,不像单机程序,到日志目录下看日志。3、遇到组件报错无从下手解决,只能不...
银行大数据·2017-07-27
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
587 会员关注
五年前已经需要处理每天百亿级数据量的时候。。
电信运营商partition revoke·2017-07-26
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
请问你代码具体做了什么操作,另外partition你用了指定了几个
银行hbase·2017-07-25
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
你这个问题造成的原因很多,我觉得最大的可能是节点之间网络连接超时,但是用hbase进行数据统计,你可以采用hbase的协处理器,每次做个累积,这样速度会快一些,
银行spark·2017-07-25
美国队长 · Alibaba 擅长领域:大数据, 大数据平台, 数据库
512 会员关注
我一般用spark如果出现性能上的问题,会先从硬件资源包括cpu ,内存,进程数,driver大小等,然后再去看代码里面是否涉及shuffle,工具也就只能告诉你当前的资源使用量如何,就算告诉你了,你还是得去看代码,另外我觉得spark自己提供的4040界面就不错,告诉你,你的job分多少个stage,每个stage...
银行大数据·2017-07-24
星星峡的风 · 福建新大陆软件有限公司 擅长领域:数据库, 系统运维, 服务器
73 会员关注
找个培训班上,这是最靠谱的办法(前提是能跟上课程进度)。
银行大数据·2017-07-24
星星峡的风 · 福建新大陆软件有限公司 擅长领域:数据库, 系统运维, 服务器
73 会员关注
我做运维,所以就都懂一些但都不精通,我仔细思考过关于在哪个技术方向深入学习的事,我的感受是,如果是dba那么就在这个方向上走下去,在mysql和主流的分布式数据库上下功夫,调优是个永无止境而且很吃技术的活,放弃自己打好的基础,去学一些别的基础知识,浪费了...
X社区推广
  • 提问题