AI-多模态-2021:FILIP【一种基于交互的细粒度图文预训练模型】

「爱情、让人受尽委屈。」 2023-09-25 14:05 135阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,135人围观)

还没有评论,来说两句吧...

相关阅读

    相关 图文训练任务整理

    引言 近些年来,随着Transformer在CV与NLP领域的广泛应用,研究者们对“多模态”的研究也越来越重视。所谓多模态,就是利用多种模态如图像、文本、音频等信息,力求