2023-06-06 21:09 已编辑腾讯_微信_算法

关注

《机器学习高频面试题详解》2.4：降维算法-奇异值分解

点击上方卡片链接就可以进入专栏，专栏右上角有订阅选项，欢迎大家订阅～

前言

大家好，我是鬼仔，今天带来《机器学习高频面试题详解》专栏的第2.4节：降维算法-奇异值分解。这是鬼仔第一次开设专栏，每篇文章鬼仔都会用心认真编写，希望能将每个知识点讲透、讲深，帮助同学们系统性地学习和掌握机器学习中的基础知识，希望大家能多多支持鬼仔的专栏～

目前这篇是试读，后续的文章需要订阅才能查看哦，专栏预计更新30+篇文章（只增不减），具体内容可以看专栏介绍，大家的支持是鬼仔更新的动力！

本文大纲
一、原理	1. 降维算法
	2. 奇异值分解
	3. 截断奇异值分解
二、面试真题	1. 简要介绍下奇异值分解？
	2. 奇异值分解的优缺点？
	3. 奇异值分解（SVD）与主成分分析（PCA）之间有何区别和联系？
	4. 描述一下 SVD 在推荐系统中的应用？
	5. 如何使用奇异值分解进行图像压缩？
	6. 如何使用奇异值分解进行文本降维？
	7. 如何优化奇异值算法计算复杂度？

一、原理

1. 降维算法

真实数据中，往往存在着很多冗余特征，需要利用降维算法进行数据压缩。降维算法可将高维数据映射到低维空间中，同时保留尽可能多的原始信息。降维在数据挖掘、图像处理、自然语言处理等领域都有广泛应用。

降维算法有以下几个优点：

1）数据可视化

处理高维数据时，往往需要对数据进行可视化展示，但是高维数据很难可视化展示。通过使用降维算法将高维数据映射到低维空间，可以更容易地实现数据可视化。

2）减少计算量

高维数据计算复杂度很高，因此将高维数据映射到低维空间，可以减少计算量，提高计算效率。对于大规模数据及高维特征数据，进行降维处理可以加快数据处理和分析的速度。

3）剔除冗余信息

高维数据中存在大量的冗余信息，这些信息对于分类、预测等任务并不重要，反而可能影响模型的准确性。通过降维算法可以去除或减少冗余信息，提高模型的准确性。

4）提高特征的鲁棒性

高维数据中可能存在特征之间的相关性或者噪音，这些信息可能会影响模型的鲁棒性。通过降维算法可以对特征进行筛选和组合，提高特征的鲁棒性，降低模型的过拟合风险。

5）数据压缩

降维算法可以将高维数据压缩到低维空间中，从而减少数据存储空间，降低数据存储成本。通常在数据传输、存储、备份等方面应用广泛。

降维算法可以分为特征变换和特征筛选两类，特征变换是将高维冗余特征变换为低维关键特征，具体可以细分为线性降维和非线性降维两类，其中线性降维算法假设数据在高维空间中呈线性分布，非线性降维算法则没有这种假设。特征筛选则是在原有特征集合中用特定算法筛选出有效特征。这篇主要讲解特征变换的线性降维算法：奇异值分解-SVD。

2. 奇异值分解

特征值分解和奇异值分解有着紧密的关系，它们的分解目的都一样，就是提取出一个矩阵最重要的特征。特征值分解可以得到特征值与特征向量，特征值表示对应特征的重要性，而特征向量表示这个特征是什么，但特征值分解有很大的局限性，要求变换的特征矩阵必须是方阵。

而奇异值分解适用于任意矩阵。如下图所示，假设A是一个N * M的矩阵，那么得到的U是一个N * N的方阵（里面的向量是正交的，U里面的向量称为左奇异向量），Σ是一个N * M的矩阵（除了对角线的元素都是0，对角线上的元素称为奇异值），V’(V的转置)是一个N * N的矩阵，里面的向量也是正交的，V里面的向量称为右奇异向量），

3. 截断奇异值分解

奇异值跟特征值类似，在矩阵Σ中也是从大到小排列，而且奇异值减少特别地快，在很多情况下，前10%甚至1%的奇异值的和就占了全部的奇异值之和的99%以上了。因为，可以用前r大的奇异值来近似描述矩阵，即可引出截断奇异值分解：

r是一个远小于m、n的数，右边的三个矩阵相乘的结果将会是一个接近于A的矩阵。r越接近于n，则相乘的结果越接近于A。这三个矩阵的存储大小远小于原始的矩阵A，当我们指定一个奇异值个数为r时(r小于数据原始的维度)，只计算前r个奇异值，就有 $A_r=U_r\Sigma_rV_r^T$ ，其中 $U_r\Sigma_r$ 就是经过降维的数据集。

二、面试真题

1. 简要介绍下奇异值分解？

奇异值分解是一种矩阵因式分解方法，简称SVD。将任何给定矩阵分解为三个矩阵的乘积：一个正交的左奇异向量矩阵、一个对角的奇异值矩阵和一个正交的右奇异向量矩阵。将数据集的奇异值表征按重要性排列，舍弃不重要的特征向量，达到降维的目的，从而找出数据中的主成分。它在应用如数据降维、信息检索、信号处理和图像压缩等领域具有重要作用。

2. 奇异值分解的优缺点？

1）优点

信息保留：SVD 使得数据保留尽可能多的原始信息。这是通过思考数据矩阵的奇异值（降序排列），然后仅使用前 k 个较大的奇异值及其对应的左右奇异向量来重构数据，实现降维的目的。
稳定性：SVD 具有优秀的数值稳定性，分解的过程通常具有较小的数值误差。因此，SVD 在处理大规模数据时，甚至在存在噪声的情况下，也可以提供令人满意的结果。
无需标签：SVD 是一种无监督的降维方法，意味着它不需要目标变量或标签来优化或调整参数。因此，它更容易对没有标签的数据应用。
去除噪声和冗余：SVD 能够捕捉数据的主要结构，并识别主成分，将噪声或副作用分离出去。这帮助减少数据中的噪音和冗余信息，从而减少后续建模的复杂性。

2）缺点

计算复杂度：SVD 的计算复杂度相对较高，尤其在处理大规模高维数据时。这可能导致降维过程变得缓慢，甚至在计算资源有限的情况下难以执行。

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

机器学习高频面试题详解文章被收录于专栏

专栏作者曾在校招期间拿到包括字节、微信和华为等多家大厂的SSP offer，该专栏主要是为了帮助同学们系统性地学习和掌握机器学习中的基础知识。专栏详细地整理了各大厂的算法岗面经，力争深入浅出地讲解重要知识点，适合人群为准备校招或者实习，且目标岗位为算法岗、数据挖掘岗或者数据分析岗的同学。

全部评论

推荐最新楼层

04-11 12:50

东方财富_服务端开发(准入职员工)

中科创达_Java_面经

南京的外包，Java需转安卓开发，面着练手，纯八股，全答出来了，两面都半小时。 二面巨逆天，原本都结束了，在反问的时候问我期望薪资嘛，我知道他家JD 薪资范围是9 - 14k，我就报了个14k，对面主管和HR跟应激了一样，一直问“你觉得你的技术怎么样”，“你觉得你跟其他人比怎么样”，“你有什么最突出的优点”，明里暗里看不上、贬低我。给不了就给不了呗。 甚至说出了“我们的确能开更高，但是你觉得你为什么值得这个价”这种话，给我气的。 第二天挂，早知道在问我其他已有 Offer 情况时，我应该直接报真实情况的。 一面 集合框架体系： 问题：简述Java核心集合框架组成 追问：解释HashM...

查看25道真题和解析

点赞评论收藏

04-11 17:34

汤臣倍健_人力_HR

汤臣倍健面经—市场管培生

其实最难的不是offer，而是进入了公司，发现累的要死，很多同学进入了工作后，朋友圈就没有更新过了，所以大家在签约的时候一定要打听清楚！ 目前的重点还是先尽量投，尽量拿到！offer就和抢演唱会票一样，抢完第一波之后等回流了，大佬拿着再多意向书，最后也只能签一个，，越厉害的，拿的offer越多，且都是非线性增长的，只要上面的人释放完意向，紧接着链式反应，大家都会有有offer的第一轮 3个人一组 面试官问问题挨个回答1.自我介绍2.简历深挖，对市场策略的内容问的非常细，问了很多候选人是如何理解xx市场的问题3.如果让你在闲鱼卖汤臣的产品，怎么写文案4.最近印象比较深的消费品5.对汤臣倍健的品...

点赞评论收藏

03-24 21:28

长沙理工大学 Java

大二下，普通一本，想实习

今年暑假想找实习还有机会吗，怎么准备去丰富简历啊，简历有什么需要修改的地方，大佬们，我太想进步了，太想进大厂了

Eeeeevans：都是校友，还是同届，我就说直白点，不委婉了，我相信你应该也不是个玻璃心，首先你觉得一个双非的绩点写简历上有用吗？班长职务有用吗？ccf有用吗？企业会关心你高数满分与否吗?第二，第一个项目实在太烂，一眼就能看出是外卖，还是毫无包装的外卖，使用JWT来鉴权，把热点数据放进Redis这两个点居然还能写进简历里，说难听点这两个东西都是学个几十分钟，调用个API就能完成的事情，在双非一本的条件下，这种项目你觉得能拿出手吗，第二个项目你写的东西和你的求职方向有任何的匹配吗?第三，计设那一块毫无价值，如果想突出自己会前端，直接写入专业技能不行吗，最后，专业技能里像深入理解JVM底层原理这种你觉得这句话你自己真的能匹配吗?都是校友加上同届，我措辞直接，但希望能点出你的问题，想进大厂还得继续沉淀项目和学习

点赞评论收藏