大数据处理
大数据处理
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘

热点

机器学习·2017-09-29
千户余音 · njiairport 擅长领域:人工智能, 云计算, 机器学习
51 会员关注
决策树(DecisionTree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。决策树是一种基本的分类和回...(more)
浏览1532
python·2017-09-29
时东南 · 外资银行 擅长领域:人工智能, 大数据, 机器学习
371 会员关注
一直以来我觉得用在运维的Selenium、PhantomJS是一个重器,不到万不得已的时候不要祭出这个大杀器,但是涉及到JavaScript及Ajax渲染的时候,Requests就完全懵逼了!最近回过头来重新审视这货,这个重器用反倒轻便了很多。1.安装Selenium、PhantomJSSelenium可以直接通过pip安装,Pha...(more)
浏览2239
机器学习·2017-09-29
silencely · 阿里 擅长领域:云计算, 大数据, 数据库
89 会员关注
1.基于历史的MBR分析基于历史(Memory-BasedReasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。MBR中有两个主要的要素,分别为距离函数(distancefunction)与结合函数(combinationfunction)。距离函数的用意...(more)
浏览1084
spark·2017-09-26
姜沫 · 鞋盒新能源 擅长领域:服务器, 存储, 主机
60 会员关注
如果您的Hadoop项目将有新的突破,那么它必定与下边介绍的七种常见项目很相像。有一句古老的格言是这样说的,如果你向某人提供你的全部支持和金融支持去做一些不同的和创新的事情,他们最终却会做别人正在做的事情。如比较火爆的Hadoop、Spark和Storm,每个人都认为他们正在做一...(more)
浏览1176
spark streaming·2017-09-25
sparker · 腾讯 擅长领域:大数据, 大数据分析, 大数据处理
7 会员关注
作者:潘国庆--1、前言随着互联网技术的迅速发展,用户对于数据处理的时效性、准确性与稳定性要求越来越高,如何构建一个稳定易用并提供齐备的监控与预警功能的实时计算平台也成了很多公司一个很大的挑战。自2015年携程实时计算平台搭建以来,经过两年多不断的技术演进,目前实时...(more)
浏览1490
证券人工智能·2017-09-25
rein07 · 某证券 擅长领域:人工智能, 大数据, 机器学习
586 会员关注
这是个比较抽象的问题,举例来说,如果通过大数据挖掘出一个客户经常查看某一支股票,但一直没有下单,则表明他可能比较看好这支股票,但是比较犹豫,这时候给他推送关于这支股票的资讯和行情,客户可能就不会那么犹豫不决了。这个过程中最重要的是数据要全,质量要高,计算方式有多种,其中...
大数据·2017-09-25
哈杜普 · 百度 擅长领域:大数据, 大数据处理, 数据库
30 会员关注
文章梳理了学习大数据挖掘分析的思路与步骤,给大家提供一些参考,希望能够对你有所帮助。最近有很多人咨询,想学习大数据,但不知道怎么入手,从哪里开始学习,需要学习哪些东西?对于一个初学者,学习大数据挖掘分析的思路逻辑是什么?本文就梳理了如何从0开始学习大数据挖掘分析,学习的...(more)
浏览4317
spark·2017-08-23
时东南 · 外资银行 擅长领域:人工智能, 大数据, 机器学习
371 会员关注
摘要十档行情指某只股票或者证券在某一时刻全市场的最低的十个卖出价格和最高的十个买入价格,每一个价格称之为一个档位。上海证券交易所市场监察部在进行数据协查和异常分析中需频繁使用个股任意时点的十档行情信息。临时还原档位行情数据的效率不高。因此,本文致力于基于...(more)
浏览2853
监控·2017-08-23
阿童木 · 某移动 擅长领域:服务器, 大数据, 人工智能
39 会员关注
摘要SparkStreaming是一套优秀的实时计算框架。其良好的可扩展性、高吞吐量以及容错机制能够满足我们很多的场景应用。本篇介绍我们在使用SparkStreaming方面的技术架构,并着重讲解SparkStreaming两种计算模型,无状态和状态计算模型以及该两种模型的注意事项;接着介绍了Spar...(more)
浏览1421
spark·2017-08-18
时东南 · 外资银行 擅长领域:人工智能, 大数据, 机器学习
371 会员关注
1概述2015年以来,随着股市的持续火爆,中国证监会、证券业协会先后发布相关文件,要求对证券公司外部信息系统接入风险加强行业监管和自律。其中要求证券公司应当建立投资者证券、资金账户风险监测模型,动态监测账户交易行为特征、客户交易终端定位信息、账户资金进出等情况,及...(more)
浏览12892
评论1

描述

大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
大数据处理大致可分为四步:采集,导入/预处理,统计/分析,挖掘
X社区推广
  • 提问题