机器学习:数据维度很高时,风控模型如何建立和应对高维数据分析?
高维存在很多问题,就如同人是三维生物,很难想象四维空间是什么样的。
高维度数据也存在很多问题,例如数据的稀疏性,任何2个数据之间的距离都很远,要知道很多模型是基于距离设计的,这些模型的效果会大大减弱。
但这是一个普遍的问题, 所以解决方法也很多,例如使用算法将数据降维到低维空间,可以使用传统机器学习的pca,使用一个简单前馈神经网络,也可以使用autoencoder,都可以大幅降低维度,信息的损失却非常少。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30