数据降维

今天药忘吃喽~ 2022-06-01 04:08 420阅读 0赞

伴随ICT(通信与信息技术)和互联网技术的不断发展与更新,人们收集和获得数据的能力越来越强。而这些数据已呈现出维数高、规模大和结构复杂等特性。如何利用这些数据,发挥其价值,引起很多人的关注和研究。这些人包括科研人员,工程技术人员,管理层领导等。

人们想利用这些大数据(维数大、规模大、复杂大),挖掘其里有意义的知识和内容以指导实际生产和具体应用,数据的降维就显得尤为重要了。数据降维,又称为维数约简。顾名思义,就是降低数据的维数。为什么要降低数据的维数?如何有效地降低数据的维数?由此问题引发了广泛的研究和应用。

数据降维,一方面可以解决“维数灾难”,缓解“信息丰富、知识贫乏”现状,降低复杂度;另一方面可以更好地认识和理解数据。

截止到目前,数据降维的方法很多。从不同的角度入手可以有着不同的分类,主要分类方法有根据数据的特性可以划分为线性降维和非线性降维,根据是否考虑和利用数据的监督信息可以划分为无监督降维、有监督降维和半监督降维,根据保持数据的结构可以划分为全局保持降维、局部保持降维和全局与局部保持一致降维等。

总之,数据降维意义重大,数据降维方法众多,很多时候需要根据特定问题选用合适的数据降维方法。

发表评论

表情:
评论列表 (有 0 条评论,420人围观)

还没有评论,来说两句吧...

相关阅读

    相关 PCA

    概念 在机器学习中经常会碰到一些高维的数据集,而在高维数据情形下会出现数据样本稀疏,距离计算等困难,这类问题是所有机器学习方法共同面临的严重问题,称之为“ 维度灾难 ”。

    相关 数据

    伴随ICT(通信与信息技术)和互联网技术的不断发展与更新,人们收集和获得数据的能力越来越强。而这些数据已呈现出维数高、规模大和结构复杂等特性。如何利用这些数据,发挥其价值,引起