高维存在很多问题,就如同人是三维生物,很难想象四维空间是什么样的。 高维度数据也存在很多问题,例如数据的稀疏性,任何2个数据之间的距离都很远,要知道很多模型是基于距离设计的,这些模型的效果会大大减弱。但这是一个普遍的问题, 所以解决方法也很多,例如使用算法将数据降维到...
显示全部高维存在很多问题,就如同人是三维生物,很难想象四维空间是什么样的。
高维度数据也存在很多问题,例如数据的稀疏性,任何2个数据之间的距离都很远,要知道很多模型是基于距离设计的,这些模型的效果会大大减弱。
但这是一个普遍的问题, 所以解决方法也很多,例如使用算法将数据降维到低维空间,可以使用传统机器学习的pca,使用一个简单前馈神经网络,也可以使用autoencoder,都可以大幅降低维度,信息的损失却非常少。
收起