大数据分析 - 主题 - twt企业IT交流平台

大数据分析

大数据分析

该主题还没有描述

330 会员关注

103 会员贡献

43 关系主题

问题

问题
热度排序 时间排序

轨道交通Hadoop·2017-11-30

Hadoop之类的分布式计算和存储平台。在这种架构下，选择物理机还是虚拟机比较合适？

panjianzhuang · IBM　擅长领域：服务器, 灾备, 存储

341 会员关注

可以考虑选择LinuxONE的虚拟机来部署，LinuxONE单台可以整合8000个虚拟机，其处理能力非常强劲，特别是节点之间需要大量通讯时，采用LinuxONE的Hipersocket技术可以做到内存级别的数据交换，可以大大提升效率。LinuxONE单机最大可以配置30TB，对与MongoDB和Hadoop及内存数据库都有很...

浏览4275

电信运营商spark·2017-09-29

问下页面发送请求，然后分布式计算再把结果返回给请求端，这个可以用spark实现吗？

美国队长 · Alibaba　擅长领域：大数据, 大数据平台, 数据库

512 会员关注

可以，用spark他也有支持应用层基级别的调用，比如spark sql等

浏览2908

软件开发大数据·2017-09-28

hadoop+saprk完全分布式集群如何安装部署？

heraleign · iwhalecloud　擅长领域：大数据, 大数据平台, 服务器

130 会员关注

可以多种方式安装部署，如果是最简单的就spark官方文档上的方式部署。给一个老版本的安装部署文档，按步骤操作是没问题的。希望对你有帮助。

浏览2471

软件开发机器学习·2017-09-19

spark 机器学习的协同过滤如何本地运行？

wnagoiyy · 尚无　擅长领域：人工智能, 分布式系统, 大数据

数据集直接放在本地解析就行了。

浏览1484

互联网服务大数据·2017-09-15

关于大数据平台搭建硬件选型建议？

y18511664518 · 长城超云　擅长领域：数据库, 存储, 关系型数据库

601 会员关注

这不用大数据平台吧，一套RAC就搞定，搞一套100T的存储，能保证你30年的数据。。。

浏览2000

互联网服务机器学习·2017-08-17

机器学习，大数据分析的安全厂商都有哪些？

黎前红 · 信息产业　擅长领域：服务器, 数据库, 云计算

77 会员关注

我知道许多公司都与深信服英方数腾合作，

浏览2096

互联网服务Hadoop·2017-08-09

Hadoop格式化时报错？

美国队长 · Alibaba　擅长领域：大数据, 大数据平台, 数据库

512 会员关注

从问题来看是你的Class版本问题，可以从下面几个方面入手1.你之前有没有格式化过，如果有就把之前的指定元数据路径给删了当然这是建立在没有数据需要备份的情况2.你能否贴一下你的格式化界面打印的完整日志3.你的hadoop在安装的时候有没有引入别的包导致两个包的版本不兼容...

浏览2286

银行Hadoop·2017-08-08

非结构化数据库hadoop如何搭建同城双活数据中心？

haizdl · 大连　擅长领域：灾备, 存储, 服务器

1235 会员关注

对于金融行业来讲，非结构化数据的业务相对比结构化业务重要度低很多。搞双活的情况不太多。一般容灾方式就是个数据复制。

浏览6384

医药认知医疗·2017-08-02

医疗大数据平台的架构设计？

haichuan0227 · 新浪云计算　擅长领域：云计算, 一体化运维, 私有云

353 会员关注

这是个topic很大，我先来个抛砖引玉，欢迎各位同学补充。1）核心层设计：数据采集->存储->清洗->[统一数据仓库]->大数据分析／挖掘->数据交换共享->顶层应用；2）采集／存储的医疗数据特点：大多非结构化，数据量大，且需要频繁读取。因此，存储采用廉价PC＋大容量SATA是不错的...

浏览4380

保险数据采集·2017-08-01

关于临床数据采集的方法讨论？

sandcun · 某股份制商业银行　擅长领域：大数据, 数据库, 服务器

124 会员关注

大概是因为有些大数据技术的使用体会，受邀答题。确实没有医疗行业经验，勉强以患者的视角来分析了，术语不专业的地方请诸位多包涵。临床数据中肯定有相当一部分的结构化数据，例如药品、血/尿检验结果等，应该是纳入传统MIS管理范畴，有成熟的技术手段，可以通过批量的数据加载方式从...

浏览4341

X社区推广

关注主题330