数据
数据
该主题还没有描述

文章

数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
数据预处理的目的:提高数据质量,数据质量的三要素:准确性、完整性、一致性。 数据预处理的任务: 数据清理 数据集成 数据规约 数据变换数据清理——填充缺失的值、光滑噪声、识别离群点、纠正数据中的不一致 缺失值:忽略元组 人工填写缺失值 使用一个全局常量 使用属性...(more)
浏览667
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
之前看了认识数据以及数据的预处理,那么,处理之后的数据放在哪儿呢?就放在一个叫“数据仓库”的地方。数据仓库的基本概念:数据仓库的定义——面向主题的、集成的、时变的、非易失的操作数据库系统VS数据仓库——为什么需要使用数据仓库分析数据(OLAP  VS  OLTP)数...(more)
浏览1923
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
之前看了认识数据以及数据的预处理,那么,处理之后的数据放在哪儿呢?就放在一个叫“数据仓库”的地方。数据仓库的基本概念:数据仓库的定义——面向主题的、集成的、时变的、非易失的操作数据库系统VS数据仓库——为什么需要使用数据仓库分析数据(OLAP  VS  OLTP)数...(more)
浏览913
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
基本概念: 基本单元:基本方体的单元 聚集单元:非基本方体的单元 冰山立方体:部分物化的立方体 最小支持度(最小支持度阀值):部分物化的最小阀值(说白了就是限定了一个范围)∵冰山立方体仍有大量不感兴趣的单元需要计算 ∴引入——闭覆盖——一个单元没有后代或者它的后代的...(more)
浏览2008
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
基本概念支持度:support 置信度:confidence 关联规则:association找出所有的频繁项集:出现次数≥最小支持计数 由频繁项集产生强关联的规则(定义最小支持度和最小置信度)频度(支持度计数):出现的次数 频繁项集:项集I的相对支持度满足预定义的最小支持度阈值 闭频繁项集:不存在真...(more)
浏览1296
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
模式挖掘是一个比频繁挖掘模式更一般的术语,因为前者还涵盖了稀有模式和负模式。然而,在没有歧义时,两者可以互换地使用。 模式挖掘路线图 分类基本模式 基于模式所涉及的抽象层 基于规则或模式所涉及的维数 基于规则或模式中所处理的值类型 基于挖掘选择性模式的约束或...(more)
浏览1478
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
决策树归纳        构造一颗树,从根到叶子节点的路径,该叶子节点就存放着该元组的预测类。                    决策树分类器的构造...(more)
浏览2109
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
贝叶斯信念网络这个贝叶斯信念网络和上一章学的朴素贝叶斯分类,最大的不同点在于:                     朴素贝叶斯分类法假定类条件独立,即给定元组的类标号,假定属...(more)
浏览1110
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
下图摘自:http://blog.163.com/qianshch@126/blog/static/48972522201092254141315/ 主要的聚类方法可以划分为以下几类:          划分方法          层次方法 &nb...(more)
浏览2256
数据·2015-06-12
qiqiwang · qiqiwang 擅长领域:大数据, 商业智能, 数据库
12 会员关注
1   基于概率模型的聚类例子:         a.评论产品,一个评论可能设计多种产品,如一个评论谈论摄像机与计算机的兼容性,怎么办?该评论与这两个簇相关,而并不互斥地属于任何一个簇。       ...(more)
浏览1090

描述

该主题还没有描述
X社区推广
  • 提问题