大数据涉及技术 - 主题 - twt企业IT交流平台

大数据涉及技术

大数据涉及技术

该主题还没有描述

159 会员关注

221 关系主题

问题

问题
热度排序 时间排序

银行数据安全·2023-03-18

数据分析探索过程中的数据安全等问题？

课题专家组

· 昆仑银行　擅长领域：人工智能, 大语言模型, 数据库

6 会员关注

数据的分类分级是数据安全工作的基础，可以借鉴《华为数据之道》中的思路，先明确数据所有者，由所有者明确数据资产目录，分类分级，数据标准，数据质量，并管理数据。

浏览1572

互联网服务实时数仓·2023-03-02

实时流计算结果如何验证结果准确性？

lzj7618937 · cib　擅长领域：云计算, 容器, 容器云

6 会员关注

实时流计算是指处理的数据源是一些不断产生新数据的连续流，并通过实时分析技术，将这些实时数据变为业务价值。流计算往往应用于大数据领域的数据分析，日志处理等场景。验证实时流计算结果准确性是非常重要且有挑战的。下面是一些验证实时流计算结果准确性的方法：1.使用样本对...

浏览1867

保险海量数据存储·2023-02-28

金融保险背景，如何保障公司核心数据安全稳定？如何对非结构化数据实时同步，提升保险公司的数据管理能力？

twt大禹 · 大禹　擅长领域：数据库, 国产数据库, 数据库选型

1 会员关注

最基础的两道威胁是磁盘静默错误和CPU静默错误，从这两项出发，传统数据库已经无法解决，无论是Mysql 、postgreSQL的魔改，还是某RocksDB、clickHouse集成的原生分布式都是解决不了。前沿数控这家企业的数据在国内某云厂商上全部丢失，就是最好的例证；能防御的貌似只有OB吧，...

浏览1336

保险存储·2023-02-03

保险行业尤其双录系统上线以后，如何更好地处理海量存储的音视频文件？

Jerry Miku · The Global 500　擅长领域：存储, 备份, 灾备

169 会员关注

如果双录是新建，可以优先采用对象存储作为主存储，设置二级存储来归档冷数据。如果双录采用原传统架构的NAS或者块存储之类，需要二次优化，推荐参考本期海量数据优化章节的文章。

浏览1625

互联网服务非结构化数据存储·2023-01-29

非结构化数据是否有必要单独治理？

联盟成员

· 第十区。散人　擅长领域：存储, 服务器, 备份

748 会员关注

我觉得未来的信息化发展中。数据治理将会是一个巨大的问题。而其中特别以非结构化数据为主。不同于传统的结构化数据。正如题主所说。非结构化数据数据量大且杂乱，类型繁多增长数度快。未来的发展中我认为很有必要把非结构化数据作为一个独立的部分进行治理。在实际环境里...

浏览2461

保险cognos·2023-01-16

cognos 界面调取数据问题？

浏览1019

银行国产数据库·2023-01-06

要在数据仓库或数据分析类系统中使用国产数据库，有哪些选型？

联盟成员

· 个人　擅长领域：数据库, 云计算, 服务器

18 会员关注

目前用过的有中兴的golden db和pcap的tidb，腾讯和阿里也都有自己的数据库产品

浏览2720

金融其它数据治理·2022-12-21

数据加总能力指什么？

课题专家组

· 某银行　擅长领域：服务器, 存储, 数据库

53 会员关注

数据加总能力一般是指数据加和汇总的能力，按照《银行业金融机构数据治理指引》要求，主要是要求银行机构进一步明确数据在全面风险管理中的价值。要求银行业金融机构应当建立数据统一集中管理的制度，确保整体数据完整性，确保各类数据之间的统合性、关联性和一致性，满足在正常...

浏览958

互联网服务信创·2022-12-14

系统迁移，国产化转信创如何实施？

匿名用户

8个小时做迁移肯定是不够的，所以这样的情况下只能做割接不能做迁移，性能也没有做测试，架构也没有做测试，像这种情况下架构肯定是要调整的，所以只能调整架构以后，业务测试通过以后，8个小时来做割接。算算你将近500tb的数据，8个小时，你通过网络来进行迁移，传输数据的时间都不够。...

浏览6468

IT咨询服务spark·2022-12-05

能否推荐一下大数据spark在冶金制造业相关项目经验和书籍？

匿名用户

对于大数据Spark在治金制造业的应用，建议可以阅读以下书籍和文献:1.《Spark大数据处理技术实战》: 该书透彻介绍了Spark的基础知识、数据处理流程和常见应用场景，并结合实际案例详解了Spark在工业领域 (包括制造业)中的应用。2.《大数据处理技术及其在治金制造业中的应用》...

浏览719

X社区推广

关注主题159