spark数据清洗原理,简单来说是,由定时器RecurringTimer周期性将任务发布给EventLoop,EventLoop接受到任务后,通过processEvent来处理ClearMetadata和ClearCheckpointData,这两个任务正是实现了清理RDD数据/元数据及checkpoint缓存数据。...
显示全部spark数据清洗原理,简单来说是,由定时器RecurringTimer周期性将任务发布给EventLoop,EventLoop接受到任务后,通过processEvent来处理ClearMetadata和ClearCheckpointData,这两个任务正是实现了清理RDD数据/元数据及checkpoint缓存数据。
收起