
活动简介
近年来,随着云计算、大数据、互联网+、AI等技术的飞速发展,在“保险+科技”的战略驱动下,保险行业整体营收逐年攀升、竞争持续加剧,保险的本质是经营风险的行业,其业务属性高度依赖于数据的积累。步入大数据时代,保险企业可获取的数据在“量级”和“维度”上都迎来了前所未有的拓展,海量业务数据的爆发为保险企业对数据价值挖掘带来了崭新的机遇。相对结构化业务数据的处理效率,保险企业对海量非结构化数据的挖掘需求更加强烈,传统技术手段的提升不再匹配保险科技的飞速发展,非结构化数据处理技术亟待创新。
目前保险行业面临的海量非结构化业务数据主要有以下四种:
• 第一种数据,保险企业在线上线下渠道投保、承保、理赔等过程中产生的客户交易信息,如身份证照片、保单扫描件、取证文件、现场照片以及数字签名校验等。此类文件数量巨大,单文件体积偏小,而且需要长期保存。
• 第二种数据,保险企业与第三方公司的交易及对账文件,如银行代理交易、中介微投保险销售等。此类非结构化数据不仅数量巨大,并且伴随高并发、高频率、高响应的处理特征。
• 第三种数据,监管单位对保险企业要求长期保留的影像、录音等多重形式的非结构化数据,如根据《保险销售行为可回溯管理暂行办法》规定的双录数据。
• 第四种数据,保险交易系统后台数据逻辑处理产生的海量过程数据,如交易报文、保单合成过程文件、打印投递处理记录等。过程数据往往是问题交易及故障排查的有力依据,拥有一定的数据保留需求。
在保险科技初期,非结构化数据数量并未形成规模,加之保险核心系统、影像系统、中间平台等业务平面的发展限制,保险企业普遍采用NAS设备存储各类非结构化数据,但随着保险业务的迅猛发展,海量非结构化数据已初具规模,NAS存储的性能、容量以及数据的可管理性会出现瓶颈。
在这次交流中,我们将根据保险业的实际情况,从以下方面进行讨论:
1、保险非结构化数据存储技术路线应该如何选择?选择NAS文件存储、HDFS文件存储还是对象存储?如果选择对象存储,选择基于开源商用产品还是闭源商用产品?
2、若将非结构化数据由传统存储迁移至对象存储或MPP系统,数据的层次结构、目录层级以及数据访问方式均可能发生变化,业务系统对迁移后数据的访问存在巨大隐患。在规划时如何针对性解决此类问题?
3、非结构化数据迁移过程中,影像数据(如图片、PDF、影像件)等典型特征数据迁移速度极慢,迁移所需时间窗口非常长,在保证业务连续性的前提下,如何有效加速由传统存储向对象存储的迁移效率?
4、非结构化数据迁移至对象存储或MPP系统后,此类数据的备份、恢复以及持久化保留相对于在传统存储上是否明显改善?主要收益如何?
本次线上同行交流,twt社区特别邀请了保险行业专家、对象存储技术专家以及戴尔科技技术专家一起参与线上交流探讨。希望本次活动能够给大家带来一些参考思路,以助大家更好的决策关于海量非结构化数据存储的选型问题。
支持企业:
答疑嘉宾
dawey 某大型券商 技术经理
长期从事Power系列主机、存储、数据库等运维工作,关注于业务系统的高可用性、连续性技术和实践。
Jerry 某保险公司 信息技术高级主管
从事服务器、存储、超融合/虚拟化等管理维护工作,负责数据中心架构优化与技术演进。
王国明 戴尔科技集团 高级系统工程师
从1993年进入IT行业后,一直负责数据存储及安全方面的技术工作,现任Dell集团高级系统工程师,负责非结构化存储产品的技术支持。
白光茁 戴尔科技集团 高级系统工程师
毕业于西北工业大学,2007年进入IT行业,先后负责数据中心运维以及IT管理、虚拟化、云计算、软件定义存储、非结构化数据解决方案的售前技术支持工作。现就职于戴尔科技集团,负责非结构化数据解决方案的售前技术支持工作。