小样本学习(Few-Shot Learning)
如果您的智能手机需要拥有数千张您的照片才能识别您并解锁,这恐怕不尽人意。 在这种情况下,小样本学习或单样本学习是机器学习中的一个热门话题,它们的模型会根据一些训练示例进行预测。
1、什么是小样本学习?
小样本学习(FSL),也称为低样本学习(LSL),是一种机器学习方法,它会训练包含有限信息的数据集。
机器学习应用领域的常见做法是提供可以接收尽可能多数据的模型。 这是因为在大多数机器学习应用程序中,提供更多数据使模型能够更好地预测。 然而,小样本学习旨在用较少的训练数据构建准确的机器学习模型。 由于输入数据的维度是决定资源成本(例如时间成本、计算成本等)的因素,因此人们可以通过使用小样本学习来降低数据分析/机器学习(ML)成本。
2、为什么小样本学习如此重要?
- 像人一样地测试学习数据:人们可以在看到几个例子后发现手写字符之间的差异。然而,计算机需要大量数据来对它们“看到”的内容进行分类,并找出手写字符之间的差异。小样本学习是一个测试基础,计算机有望从人类等少数例子中学习。
- 罕见情况学习:通过使用小样本学习,机器可以学习罕见情况。例如,在对动物图像进行分类时,使用小样本学习技术训练的机器学习模型可以在接触少量先验信息后正确分类稀有物种的图像。
- 减少数据收集工作和计算成本:由于小样本学习需要较少的数据来训练模型,因此消除了与数据收集和标记相关的高成本。训练数据量少意味着训练数据集中的维数低,可以显着降低计算成本。
3、小样本学习应用在哪些领域?
计算机视觉:计算机视觉探索计算机如何从数字图像或视频中获得高级理解。少样本学习主要用于计算机视觉中,用于处理以下问题。
- 字符识别
- 图像分类
- 物体识别
- 手势识别
其他对象相关应用:
- 对象跟踪
- 零件标签
其他图像应用:
- 图像检索
- 图像生成
- 图片说明
- 场景位置识别
- 3D 对象的形状视图重建
视频应用
- 视频分类
- 运动预测
- 动作本地化
- 人员重新识别
- 事件检测
自然语言处理 (NLP):Few-shot learning 使自然语言处理 (NLP) 应用程序能够使用少量文本数据示例完成任务。
- 解析
- 翻译
- 短语完善
- 快速情绪分类
- 用户意图分类的图表系统
- 刑事指控预测
- 单词相似性
- 文本分类
音频处理:包含有关语音/声音信息的数据可以通过声学信号处理进行分析,并且小样本学习可以实现以下任务的部署。
- 从用户的一些音频样本中克隆语音
- 从一个用户到另一个用户的语音转换
- 跨语言的语音转换
机器人化:为了让机器人表现得更像人类,它们应该能够从一些演示中概括信息。因此,小样本学习在训练机器人完成某些任务方面起着至关重要的作用。
- 通过模仿单个演示来学习动作
- 从一些演示中学习操作动作
- 视觉导航
- 连续控制
卫生保健:
- 小样本药物发现
- COVID-19 诊断
其他应用:
- 物联网分析
- 曲线拟合
- 逻辑推理
4、小样本学习的原理是什么?
小样本学习(FSL)可以被认为是一个元学习模型问题,该模型学习如何学习解决给定的问题。
我们以一个图像分类问题为例:
- 该模型输入了一些不同类别的示例图像(称为 N-way-K-shot 分类),并使用不同的图像重复解决此任务。
- 例如,上图显示了一个 3-way-2-shot 分类问题,其中每个任务涉及支持集中 3 种不同动物的 2 张图片,模型尝试对查询集中的图像进行分类。
- 该模型通过每个不相关的任务提高了对动物进行分类以正确分类的准确性。
- 然后在一组不同的分类任务上测试模型的性能。
5、小样本学习和零样本学习有哪些不同之处?
小样本学习旨在让 ML 模型在训练数据集中有少量示例可用时预测正确的实例类别。零样本学习旨在预测正确的类,而不暴露于训练数据集中属于该类的任何实例。零样本学习和小样本学习具有共同的应用,例如:
- 图像分类
- 语义分割
- 图像生成
- 物体检测
- 自然语言处理
最后,还有单样本学习,它经常与零样本学习混合使用。单样本学习是一种特殊类型的小样本学习问题,其目的是从一个训练样本/图像中学习有关对象类别的信息。智能手机使用的人脸识别技术就是单样本学习问题的一个例子。
小样本学习(Few-Shot Learning) - 知乎
还没有评论,来说两句吧...