活动简介
随着信息技术的发展,企业数据量急速膨胀。数据的容量变的更大,数据增长速度变得更快,数据的格式变得更复杂,数据处理的需求变得更迫切,这些都给ETL带来了新的挑战。设计能够有效支撑大数据处理的ETL架构尤为重要。网络、存储、IO都对ETL的效率有极大影响。传统企业在搭建大数据平台ETL过程中,需要注重底层架构对ETL效率的优化。
1. 大数据环境下,ETL的架构设计的有哪些关键点?
2. 与传统数据仓库相比,大数据平台ETL对基础架构层的要求有哪些不同?
3. 在网络、存储、IO等基础架构层面,可以从哪些方面优化ETL的效率?
活动嘉宾
徐彦辉 58同城大数据平台高级架构师
2010年加入趋势科技,开始了基于在Linux系统上构建Hadoop平台的生涯。喜欢钻研基于Hadoop、Spark的大数据技术,专注于互联网公司大数据平台建设。