【机器学习面试场景问题】-编程知识

【机器学习面试场景问题】

1、ResNet是什么？

‌ResNet（Residual Network，残差网络）是一种在深度学习领域中非常重要的卷积神经网络（CNN）架构。

ResNet的核心思想是残差学习，通过学习输入与输出的残差，简化优化任务。其关键结构是残差块，通过短连接（Skip Connection）直接跳过部分非线性层，将输入直接传递至输出，有效缓解梯度消失问题‌。

2、张量与向量的关系？

向量是一维的，可以看作是一阶张量，而张量是一个更广泛的概念，可以有多个维度。在深度学习中，张量是非常重要的数据结构，用于表示和处理多维数据。下图展示了张量在不同维度的形式:

3、分割算法的作用？

图像分割算法通过像素级解析为计算机视觉任务提供基础数据，其作用贯穿于感知、分析与决策的各个环节。

深度学习中的图像分割算法通过像素级分类实现对图像的精细化分析与理解，其核心作用包括以下方面：

4、分割任务的类型‌？

5、深度学习中的Mask是什么？

Mask在深度学习中扮演‌“像素级导航”‌角色，通过精准的区域标识，支持分割、检测、生成等任务。

Mask（掩膜）‌ 是一个关键概念，尤其在图像分割、目标检测和生成任务中广泛应用。

它通常是一个与输入数据（如图像）‌同尺寸的二值矩阵或类别矩阵‌，用于标识特定区域或像素的归属（如属于目标、背景或类别）。

Mask的核心作用‌

6、反向传播之前为什么要梯度清零？

梯度清零是为了防止多个批次的梯度叠加，确保每次参数更新仅基于当前批次的计算结果，避免训练不稳定或错误更新。

默认行为：在PyTorch等框架中，梯度是累积的（gradient accumulation）。每次调用 .backward() 计算梯度时，新的梯度会累加到之前的梯度上，而不是覆盖。
不清零的后果：如果不清零梯度，多个批次的梯度会叠加，导致参数更新时的梯度值过大，可能引发以下问题：
- 模型参数更新不稳定（震荡或爆炸）；
- 训练过程无法收敛；
- 损失函数剧烈波动。

7、关于数据增强

在有限的数据集中，通过数据增强，达到提升识别准确度和解决图像损坏、位置被遮挡的问题。

一般常用前两种方法：空间转换和颜色扭曲

同时对数据样本进行下面的操作，模拟异常场景，也可以提升模型的整体识别能力和抗干扰能力；

8、BP神经网络是什么？

BP神经网络（Backpropagation Neural Network）是一种利用反向传播算法进行训练的多层前馈神经网络。

基本结构

工作原理

反向传播算法

梯度计算：通过链式法则，从输出层到输入层逐层计算损失函数对权重的梯度。
- 输出层误差：损失函数对输出的导数 × 激活函数导数。
- 隐藏层误差：将误差按权重分配至前一层，结合激活函数导数逐层回传。
权重更新：使用梯度下降法（如SGD、Adam）调整权重，减小损失。

优缺点

优点：
- 可逼近任意连续函数（万能逼近定理）。
- 适用于分类、回归等多种任务。
缺点：
- 梯度消失/爆炸：深层网络中梯度可能不稳定，影响训练（ReLU、残差结构可缓解）。
- 过拟合：参数多易拟合噪声（Dropout、正则化应对）。
- 计算成本：全连接层参数多，训练耗时。