机器学习:数据维度很高时,风控模型如何建立和应对高维数据分析?

机器学习:数据维度很高时,风控模型如何建立和应对高维数据分析?

参与5

2同行回答

victoryleevictorylee  软件开发工程师 , 浪潮商用机器有限公司
高维存在很多问题,就如同人是三维生物,很难想象四维空间是什么样的。 高维度数据也存在很多问题,例如数据的稀疏性,任何2个数据之间的距离都很远,要知道很多模型是基于距离设计的,这些模型的效果会大大减弱。但这是一个普遍的问题, 所以解决方法也很多,例如使用算法将数据降维到...显示全部

高维存在很多问题,就如同人是三维生物,很难想象四维空间是什么样的。

高维度数据也存在很多问题,例如数据的稀疏性,任何2个数据之间的距离都很远,要知道很多模型是基于距离设计的,这些模型的效果会大大减弱。

但这是一个普遍的问题, 所以解决方法也很多,例如使用算法将数据降维到低维空间,可以使用传统机器学习的pca,使用一个简单前馈神经网络,也可以使用autoencoder,都可以大幅降低维度,信息的损失却非常少。

收起
互联网服务 · 2023-01-08
浏览458
兰花花兰花花  软件开发工程师 , 中国人民银行清算总中心
图灵奖 VC维显示全部

图灵奖 VC维

收起
软件开发 · 2019-09-19
浏览1471

提问者

topzgm
topzgm0112
软件架构设计师People's Bank of China
擅长领域: 数据库服务器存储

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2019-09-11
  • 关注会员:3 人
  • 问题浏览:2212
  • 最近回答:2023-01-08
  • X社区推广