大数据(Big Data),是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。...(more)
来自主题:大数据 · 5天前
韩成亮KE 擅长领域:MySQL, 数据库, Oracle
301 会员关注
关于问题1其实可以采用syner 实时同步https://pingcap.com/docs-cn/stable/reference/tools/syncer/ Syncer 是一个数据导入工具,能方便地将 MySQL 的数据增量导入到 TiDB,支持分库 或者直接采用DM,参考https://pingcap.com/docs-cn/stable/reference/tools/data-migration/...(more)
浏览1137
回答1
来自主题:分布式存储 · 2019-11-08
吕作令XSKY 擅长领域:分布式存储, ceph, OpenStack
7 会员关注
不建议,建议硬盘直通进操作系统。做2-3副本保障数据安全。 1、如果在底层配置RAID组,把VD给Ceph,只做单副本相当于每个VD一个OSD。在VD出现问题后,由于数据是1副本,会数据丢失风险。2、底层RAID在做数据恢复时,也会影响ceph集群异常3、增加了集群运维难度,增大了集群风险点...(more)
浏览3450
回答1
来自主题:医院信息集成平台 · 2019-10-28
heray2323中山大学附属肿瘤医院 擅长领域:医院信息集成平台, 数据集成平台, 大数据
131 会员关注
集成平台是解决集成交互的问题;临床数据中心cdr解决的结构化数据统一存储,标准化,数据提供的问题;大数据平台的部分数据可以直接从CDR获取,或者通过集成平台的总线消息分发机制,在数据进入CDR前,直接提供给大数据平台。...(more)
浏览1066
回答2
来自主题:自动化运维 · 2019-10-28
zjwy82bank 擅长领域:自动化运维, 银行自动化运维, CMDB
47 会员关注
首先我表达个人观点,运维数据统一治理并非自动化的先行条件,需要先把运维数据概念的定义以及自动化运维的覆盖范围厘清。我更倾向于配置管理是自动化运维的先决条件。先说说对运维数据的理解,我所认为有几类,一类是描述生产资源的数据即我们常说的配置数据,另一类是生产资源运...(more)
浏览2814
回答9
来自主题:大数据 · 2019-10-16
EricWang日志易 擅长领域:大数据分析, 大数据
5 会员关注
您好,根据您的描述和要求想提出几点建议参考,首先您提出的运维大数据都包含哪些?运维基础是日志可以解决绝大数问题。如果是这样日志易完全够用。但实际情况要建设好运维大数据平台的话还得纳入一些网络流量和数据库数据这时候可以考虑引入流量工具。在数据做好整理后可能会...(more)
浏览3460
回答3
来自主题:大数据 · 2019-10-10
匿名用户
这么大的题实在无法解答,你可以去搜个产业报告看看整体的形式和现状吧!
浏览984
回答1
来自主题:大数据平台 · 2019-09-30
huangdkIBM 擅长领域:Db2
13 会员关注
看看文档升级hdp
浏览695
回答1
来自主题:数据治理 · 2019-09-18
amu0722打毛党 擅长领域:cognos, 商业智能, 数据仓库
47 会员关注
数据治理工具范畴太大,其实数据治理是从上而下的工作整风运动,跟工具关系不大
浏览1333
回答1
来自主题:大数据 · 2019-09-16
匿名用户
国产数据库: TDSQL 、 POLARDB 、SequoiaDB、OceanBase、 TiDB
浏览792
回答2
来自主题:数据建模 · 2019-09-11
看公司实力吧,如果只是想省事可以购买一套(比如我司的)。如果想针对自己公司的特定的环境的话很可能就得自己开发了。 但是我建议只是研究算法部分就好了,至于数据采集之类的前期工作网上找找开源的就行了。 ...(more)
浏览1343
回答1
来自主题:机器学习 · 2019-09-11
机器学习:模型预测的准确性如何判定?
浏览578
来自主题:机器学习 · 2019-09-11
机器学习:数据维度很高时,风控模型如何建立和应对高维数据分析?
浏览728
回答1
来自主题:机器学习 · 2019-09-11
机器学习:风控系统如何和业务系统对接,形成数据信息闭环,提现业务价值?
浏览570
来自主题:机器学习 · 2019-09-10
风控中机器学习模型和传统规则怎么有机结合,一张卡在一段时间内消费两次的离散化和连续化表示是什么,组合特征是否能提高模型的可解释性,如果是,为什么能提高,以及它怎么体现在模型的可解释性上...(more)
浏览955
回答1
来自主题:批处理 · 2019-09-09
lxk215313951城市商业银行 擅长领域:数据同步, 双活数据中心, 存储双活
12 会员关注
大数据处理,这是hbase等数据库的强项呀,建议选用hadoop平台进行存储、处理,硬件直接堆x86服务器就行,性价比高
浏览1247
回答1
来自主题:智能风控 · 2019-09-06
国际银行行业对于智能风控的实施案例有哪些,是否可借鉴?基于的文章理论又有哪些?
浏览1640
回答1
来自主题:人工智能 · 2019-09-06
以智能风控的反欺诈为例,判断用户为存在欺诈行为,如何形成报告对这个结论进行论证,以便更好的对用户进行解说或立案,机器学习的难点之一是如何对结果进行解释,是否足以应对客户的投诉?如果涉及法律问题是否可以作为立案证据?...(more)
浏览1631
回答1
来自主题:智能风控 · 2019-09-06
数据作为智能风控的基础,但是银行行业的数据具有保密性,对外共享的数据有限,而且有些机构是不允许对外发布交易数据,这会导致数据也不全,在数据存在缺陷的条件下,智能风控得出的结论是否具有可参考性?...(more)
浏览1722
回答1
来自主题:数据仓库 · 2019-09-04
王奇阜新银行 擅长领域:实时数仓, 数据仓库, 数据建模
1 会员关注
这个问题比较大啊。1 数据的收集 .ODS2.想好大数据和传统数仓之间的关系3.传统数据与大数据之间的数据交互
浏览1571
回答1