陈坤儿子,学界 | Facebook、谷歌别离改善何恺明 FPN 作业,五菱宏光

admin3个月前178浏览量

AI 科技谈论按:在核算机视觉范畴中,多维度方针检测一向被用作输入以生成反映不同维度信息的特征组合,这种办法能够有用表达图片上的各种维度特征,但是却对硬件核算才能及内存大小有较高要求,因而只能在有限的范畴内部运用。Facebook 于 2016 年在论文《Feature Pyramid Networks for Object Detection》中提出的 FPN,经过运用惯例 CNN 模型内部从底至上各个层对同一 scale 图片不同维度的特征表达结构,提出了一种可有用在单一图片视图下生成对其的多维度特征表达的办法。近期,Facebook 和谷歌连续发布了根据 FPN 的改进工作,咱们将之收拾如下。

2018 年头,Facebook 还在论文《Panoptic Segmentation》中对全景切割 Panoptic Segmentation 使命进行了研讨,并提出了自己的处理方案 Panoptic FPN。因为全景切割使命近期开端变得抢手,Facebook 考虑把 FPN 模型用于一次性处理全景切割使命,所以在本年 1 月发布了《Panoptic Feature Pyramid Networks》,以下为论文摘要:

咱们近期引介的全景切割使命,成功引起了社区关于一致实例切割与语义切割使命的爱好。但是,当时用于处理该联合使命的最先进办法,仍然运用的是独立且不类似的网络,因而未具有相应的同享核算。在这项工作中,咱们的方针是在架构层面一致这些办法,为两个使命规划一个一致的网络。咱们将作为语义切割办法分支的同享特征金字塔网络(FPN)与 Mask R-CNN(一种盛行的实例切割办法)进行结合。令人惊奇的是,这个简略的基线不仅对示例切割使命有用,并且还产生了一种轻量级、功能拔尖的语义切割办法。在这项工作中,咱们对带有 FPN 的 Mask R-CNN 进行了具体研讨,咱们将之称为 Panoptic FPN,并成功展现关于两个使命而言,它是一个稳健且精确的基线。鉴于其有用性和概念性简略,咱们期望该办法能帮到未来的全景切割研讨。

论文链接:

https://arxiv.org/abs/1901.02446

本年 4 月 16 日,谷歌接着发布一篇名为《NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection》论文,提出一项能够更好用于方针检测的 NAS-FPN。该论文已被 CVPR 2019 接纳,以下为论文摘要:

现在用于物体检测的最先进卷积体系结构都是人为规划的。因而,咱们的方针是为物体检测构建一个更好的特征金字塔网络架构。咱们选用神经架构查找(Neural Architecture Search),在一个包括一切跨规划衔接的新式可扩展查找空间中发现了新的特征金字塔架构, 这个被命名为NAS-FPN的架构由自上而下和自下而上的衔接组合而成,可跨规划进行交融。与最先进的物体检测模型比较,在 RetinaNet 结构里调集了各种主干模型的 NAS-FPN 能到达更好的精确性和推迟权衡。与最先进的 SSDLite + MobileNetV2 模型比较,NAS-FPN 成功将移动检测的精度提高了 2 AP,并以 48.3 AP 成功逾越 Mask R-CNN 的检测精度,并且运用的核算时刻更短。

论文链接:

https://arxiv.org/abs/1904.07392

点击阅览原文,检查 「方针检测算法」连连看:从Faster R-CNN 、 R-FCN 到 FPN

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。

最新评论