项目实践中对语义分割网络DeepLabV3+的改进 拼搏现实的明天。 2022-01-31 06:29 1760阅读 4赞 # 概述 # 最近用DeepLabV3+做了一些语义分割的工作,从github上下载了别人实现的tensorflow实现。发现速度不能满足需求,所以本人对DeepLabV3+做了一些改进。 # 原始的网络结构 # 下图左侧是DeepLabV3的结构,中间是U-Net风格的编解码结构,最右侧就是DeepLabV3+的结构。和V3相比,V3+融合了一次底层特征图(主干网络也换了,但是这里体现不出来)。 ![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3l1YW5sdWx1_size_16_color_FFFFFF_t_70] # 改进方向 # ### 替换backbone ### DeepLabV3+论文里的backbone是Xception, 我下到的工程里用的是ResnetV2-50和ResnetV2-101。 整体的模型保存为PB有一百多M, 在CPU上的运行时间是1秒多。 为了加快网络速度,将backbone替换为MobileNetV2。 ### 使用深度分离卷积替换普通卷积 ### ASPP部分和decoder部分的参数数量同样吓人,为此把所有的普通卷积替换为深度分离卷积。 同时ASPP和decoder部分的通道数量也做了一定的删减。 ### 增加一次对底层特征的融合 ### 在做身份证部件解析的时候发现细节切分效果较差。为了改善细节,将1/2大小的特征图和decoder特征进行融合,最终取得了不错的效果。 ![在这里插入图片描述][watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3l1YW5sdWx1_size_16_color_FFFFFF_t_70 1] # 最终效果 # 整个模型保存为PB固化文件后只有2.5M, 300x400的图片解析时间在CPU上0.2秒左右。 图片效果见《[基于语义分割的身份证部件解析和文字检测][Link 1]》 # 参考资料 # DeeplabV3+:[Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation ][Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation] [基于语义分割的身份证部件解析和文字检测][Link 1] [这就是神经网络 12:深度学习-语义分割-DeepLabV1、V2、V3和V3+][12_-_-DeepLabV1_V2_V3_V3] [人脸解析(Face Parsing)和人体解析Human Parsing:方法、数据集和论文][Face Parsing_Human Parsing] [watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3l1YW5sdWx1_size_16_color_FFFFFF_t_70]: /images/20220131/0d69ff6907214d9c88593105279121c6.png [watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3l1YW5sdWx1_size_16_color_FFFFFF_t_70 1]: /images/20220131/549bb426129c45f79ccbb187b02ae64f.png [Link 1]: https://blog.csdn.net/yuanlulu/article/details/90081644 [Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation]: http://openaccess.thecvf.com/content_ECCV_2018/papers/Liang-Chieh_Chen_Encoder-Decoder_with_Atrous_ECCV_2018_paper.pdf [12_-_-DeepLabV1_V2_V3_V3]: https://blog.csdn.net/yuanlulu/article/details/88930810 [Face Parsing_Human Parsing]: https://blog.csdn.net/yuanlulu/article/details/88580741
相关 【计算机视觉】最全语义分割模型总结(从FCN到deeplabv3+) 文章目录 一、前言 1.1 语义分割 二、FCN:CNN语义分割的开山之作 2.1 结构 2.2 特点 三、Dee 心已赠人/ 2023年09月27日 16:28/ 0 赞/ 114 阅读
相关 语义分割算法之DeepLabV3+论文理解及代码分析 前言 之前讲了DeepLabV1,V2,V3三个算法,DeepLab系列语义分割还剩下最后一个DeepLabV3+,以后有没有++,+++现在还不清楚,我们先来解读一下这 拼搏现实的明天。/ 2023年06月14日 04:20/ 0 赞/ 101 阅读
相关 憨批的语义分割5——DeeplabV3+模型解析以及训练自己的DeeplabV3+模型(划分斑马线) 憨批的语义分割5——DeeplabV3+模型解析以及训练自己的DeeplabV3+模型(划分斑马线) 学习前言 模型部分 什么是DeeplabV3 墨蓝/ 2023年06月12日 09:13/ 0 赞/ 34 阅读
相关 【深度学习】像素级分割网络新思路之DeepLabv3+ 【深度学习】像素级分割网络新思路之DeepLabv3+ 1 版本情况 2 引言&相关工作 3 空洞卷积(Dilated/Atrous Convol Bertha 。/ 2023年01月18日 06:49/ 0 赞/ 121 阅读
相关 语义分割网络——FCN FCN介绍 ![watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV Myth丶恋晨/ 2023年01月05日 05:26/ 0 赞/ 368 阅读
相关 憨批的语义分割重制版8——Keras 搭建自己的DeeplabV3+语义分割平台 憨批的语义分割重制版8——Keras 搭建自己的DeeplabV3+语义分割平台 注意事项 学习前言 什么是DeeplabV3+模型 代码下载 亦凉/ 2022年12月28日 11:26/ 0 赞/ 309 阅读
相关 语义分割学习笔记3——运行语义分割程序 语义分割学习笔记3——运行语义分割程序 一、linux安装依赖环境 1、创建open-mmlab环境 2、安装pytorch 清疚/ 2022年10月08日 11:16/ 0 赞/ 637 阅读
相关 憨批的语义分割重制版9——Pytorch 搭建自己的DeeplabV3+语义分割平台 憨批的语义分割重制版9——Pytorch 搭建自己的DeeplabV3+语义分割平台 注意事项 学习前言 什么是DeeplabV3+模型 代码下载 秒速五厘米/ 2022年09月10日 05:20/ 0 赞/ 714 阅读
相关 项目实践中对语义分割网络DeepLabV3+的改进 概述 最近用DeepLabV3+做了一些语义分割的工作,从github上下载了别人实现的tensorflow实现。发现速度不能满足需求,所以本人对DeepLabV3+做了 拼搏现实的明天。/ 2022年01月31日 06:29/ 4 赞/ 1761 阅读
相关 DeepLabv3+:语义分割领域的新高峰 这是 PaperDaily 的第 44篇文章 关于作者:陈泰红,小米高级算法工程师,研究方向为人脸检测识别,手势识别与跟踪。 ■ 论文 | Encoder-Decoder ゝ一世哀愁。/ 2022年01月31日 02:45/ 0 赞/ 885 阅读