关于用于建模和机器学习的技术方案？

目前是技术方案选择的问题我们目前拥有离线区块链交易数据数据体量：30亿条交易数据，每条交易包含10个字段（主要的字段：发送地址、收款地址、交易类型、交易金额）我们想做的：根据业务需求提出分析策略，利用机器学习建立模型输出分析结果，为交易地址打上标签策略比如：实体聚集：多个账...显示全部

参与5

查看其它 1 个回答hym38的回答

hym38软件架构设计师某银行

30亿的数据量不算太大，用spark就可以搞定清洗，加工和必要一些特征工程的的工作了。从建模的角度来说，如果对分布式有要求pyspark挺好的。否则，直接用python灵活度会更高。