非结构化数据的存储及解决思路?

海量非结构化数据存储优化方面,使用对象存储技术,还是分布式存储技术,亦或是分布式对象存储?对于PB级的非结构化数据存储,目前有哪些存储厂家的设备能够提供对应的应用场景?在非结构化数据的备份上,有什么可行的解决方案...显示全部

海量非结构化数据存储优化方面,使用对象存储技术,还是分布式存储技术,亦或是分布式对象存储?对于PB级的非结构化数据存储,目前有哪些存储厂家的设备能够提供对应的应用场景?在非结构化数据的备份上,有什么可行的解决方案

收起
参与20

查看其它 5 个回答SandStone杉岩数据的回答

SandStone杉岩数据SandStone杉岩数据中国对象存储市场领导厂商深圳市杉岩数据技术有限公司

非结构化数据往往结构不规则或不完整、缺乏预定义数据模型、格式多种多样,我们常见的图片、音频、视频、文档等,都属于非结构化数据,其往往呈现出数量多、类型多样等特点。 面对海量非结构化数据,尤其是在小文件场景下,传统NAS在容量扩展性、性能、文件检索和管理便捷性上都存在诸多问题。
文件存储通过将数据划分为类别、目录和文件夹来获取非结构化数据并将其结构化,由此用户可以快速轻松地查询搜索。因此,如果组织要处理的非结构化数据量有限,文件存储是最佳选择。
而一旦文件数达到数千万级别,目录树越建越深,容易造成性能和查询效率急剧下降,文件管理困难,扩容和运维也会变得繁琐,严重影响业务效率。
对于对象存储来说,应对爆炸性增长的非结构化数据简直是小菜一碟。
1.超大容量和强扩展性
采用分布式架构,基于通用服务器,部署对象存储软件,可以灵活添加节点实现按需在线扩展,支持EB级存储容量,不影响生产业务。
2.海量小文件存储场景性能优异
通过更扁平的Key直接访问后端的对象,通过小文件合并、元数据独立扩展、元数据有序优化等技术,提升海量小文件业务场景性能。
3.天然拥抱云和互联网
基于标准的S3或OSS接口,可以在私有云环境与公有云存储之间进行数据流动;支持跨互联网访问,无需OS挂载更轻量,对于人工智能、机器学习、物联网、云原生等新兴应用友好。
4.数据安全可靠
通过副本、纠删码、亚节点纠删等数据保护机制,WORM防篡改、桶内数据加密等功能,以及同城双活、异地容灾能力,全面保障数据安全。
5.赋能数据价值挖掘
对象存储可以通过与智能数据处理软件结合,实现对非结构化数据进行多维度标签化和结构化处理,实现快速标签检索;并将图片转码、视频抽帧、OCR识别等数据处理能力下沉到存储系统内部,提升数据管理能力,降低成本并简化业务流程。

软件开发 · 2023-11-08
浏览359

回答者

SandStone杉岩数据
中国对象存储市场领导厂商深圳市杉岩数据技术有限公司
擅长领域: 存储灾备分布式架构

SandStone杉岩数据 最近回答过的问题

回答状态

  • 发布时间:2023-11-08
  • 关注会员:7 人
  • 回答浏览:359
  • X社区推广