大模型-DeltaTuning-增量式03：Prompt-Tuning（连续型）（P-tuning v1）【只在输入层加入可训练参数层】

谁借莪１个温暖的怀抱￠ 2023-10-12 16:56 47阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，47人围观）

还没有评论，来说两句吧...

相关阅读

相关 LLM-大模型训练-步骤(二)-预训练/Pre-Training(2)：重参数式预训练(Part-Param Pre-Training)【Lora/ptuning...】【中文无监督学习语料】

GitHub项目：[KnowLM][]、[Chinese-LLaMA-Alpaca][] 二、Pre-Training sample data pt\_sample\_

我就是我/ 2024年03月16日 22:45/ 0 赞/ 71 阅读

相关大模型-DeltaTuning-增量式03：Prompt-Tuning（连续型）（P-tuning v1）【只在输入层加入可训练参数层】

一、前言 Bert时代，我们常做预训练模型微调（Fine-tuning），即根据不同下游任务，引入各种辅助任务loss和垂直领域数据，将其添加到预训练模型中，以便让模型更

谁借莪１个温暖的怀抱￠/ 2023年10月12日 16:56/ 0 赞/ 48 阅读

相关大模型-DeltaTuning：①增量式（原模型参数不变，插入可微调参数层）、②指定式（原模型参数冻结一部分参数，微调一部分参数）、③重参数化式（将原模型参数层改造，比如插入低秩）

【随着模型增大，各方案区别不大】 ![9c2b5ab5be484724ab9f0f473db60f2c.png][] ![b71bc8fda98448d3866afd79

曾经终败给现在/ 2023年10月12日 13:07/ 0 赞/ 70 阅读

相关大模型-DeltaTuning-增量式01：Adapter-tuning（0.5-8%）【每个transformer层内加入2个Adapter层】【Adapter就是先降维再升维的全连接】

Adapter Tuning 随着计算机硬件性能的提高，预训练模型参数量越来越多，在训练下游任务时进行全模型微调变得昂贵且耗时，Adapter 的出现缓解了这个问题。Ad

╰半夏微凉°/ 2023年10月12日 12:41/ 0 赞/ 31 阅读

相关大模型-DeltaTuning-增量式02：Prefix-tuning（0.1% parameters）【每个transformer层的hidden states前一些soft token】

Fine-tuning是使用大规模预训练语言模型来进行下游任务的流行范式，但需要更新和存储语言模型的全部参数。再运用到下游任务时，需要对每一个任务都需要存储一份修改后的参数。L

逃离我推掉我的手/ 2023年10月12日 12:40/ 0 赞/ 54 阅读

相关大模型-DeltaTuning-增量式04：p-tuning v2【在Transformer原有结构最后插入一层pre_encoder层】【微调时冻结原有结构参数，只微调新加入的网络层参数】

案例：chatGLM !/usr/bin/env python coding=utf-8 Copyright 2021 The HuggingFa

缺乏、安全感/ 2023年10月12日 12:40/ 0 赞/ 47 阅读

相关 pytorch载入预训练模型后，训练指定层

1、有了已经训练好的模型参数，对这个模型的某些层做了改变，如何利用这些训练好的模型参数继续训练： pretrained_params = torch.load('Pr

Bertha 。/ 2023年06月15日 15:29/ 0 赞/ 58 阅读

相关 1.2.3 TCP/PI参考模型（应用层、传输层、网际层、网络接口层）、五层参考模型（应用层、传输层、网络层、数据链路层、物理层）、OSI与TCP/IP参考模型比较（转载）

原文链接：[https://blog.csdn.net/weixin\_43914604/article/details/104597450][https_blog.csdn.

拼搏现实的明天。/ 2022年12月29日 00:11/ 0 赞/ 240 阅读

相关 1.2.2 OSI参考模型（应用层、表示层、会话层、传输层、网络层、数据链路层、物理层）（转载）

原文链接：[https://blog.csdn.net/weixin\_43914604/article/details/104589085][https_blog.csdn.

分手后的思念是犯贱/ 2022年12月29日 00:11/ 0 赞/ 297 阅读

相关 Redis加入服务层缓存

1. 需要做的事情 1、 Redis服务搭建 2、为功能添加缓存功能 2. redis介绍 2.1. 什么是redis Redis是用C语言开发的一个开

以你之姓@/ 2022年05月29日 23:56/ 0 赞/ 292 阅读